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Resumo 


“E o objetivo de apresentar a Teoria dos Jogos e da Cooperação e debater seus 
principais conceitos entre pesquisadores da área de Filosofia, o livro está dividido 
em duas etapas com quatro unidades cada. Na primeira, são introduzidos os conceitos 
básicos e a história da Teoria dos Jogos; o papel da comunicação; a evolução da coo- 
peração; e o Dilema dos Prisioneiros Iterado (DPI). Na segunda seção, os torneios e 
as simulações envolvendo o DPI e suas variantes são discutidos; na segunda unidade, 
o modelo de jogo chamado Bens Públicos é descrito e avaliado; assim como o Jogo do 
Ultimato, na terceira unidade. Por fim, a quarta unidade encerra o livro com os pro- 
blemas surgidos com as simulações de tais jogos em laboratórios e as consequências 


para ética e política que a utilização desse instrumento de análise traz nas diversas 


áreas onde é aplicado. 
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Capítulo 1 
História e Conceitos Básicos 


ogos de tabuleiro, dados, cartas ou, em geral, jogos de salão divertem a humanidade 
J desde a formação das primeiras civilizações. Escavações feitas em sítios arqueoló- 
gicos localizados na região do Oriente Médio conhecida como Mesopotâmia encontra- 
ram, em túmulos de nobres e membros da família real que dominava a antiga cidade 
de Ur - importante centro da civilização suméria, por volta de 3000 a.C. -, um jogo de 
tabuleiro que foi batizado como Jogo Real de Ur - provável ancestral da série de jogos 
que evoluíram até o gamão moderno. À se acreditar nas lendas indianas, a atividade 
lúdica, além de entreter seus praticantes, também serviria como simulação alegórica 
de batalhas ou deliberações que as pessoas têm de fazer ao longo de sua vida cotidia- 
na - o xadrez e o já mencionado gamão seriam exemplos disto. Por colocar as pessoas 
em situações nas quais vencer ou perder dependem das escolhas feitas adequadamente 
logo no início das partidas, os jogos se mostraram como excelente ferramenta para o 
desenvolvimento da personalidade e da inteligência das crianças. 


Entretanto, apesar desse aspecto pedagógico, os jogos raramente eram conside- 
rados objetos de estudo sério. Foi a curiosidade do nobre Cavaleiro de Méré e invetera- 
do jogador, Antoine Gombaud (1607-1684), que, em 1654, incentivou o filósofo francês 
Blaise Pascal (1623-1662) a iniciar correspondência com outro brilhante matemático 
francês, Pierre de Fermat (1601-1665), no intuito de solucionar com maior rapidez 
o problema dos pontos, num jogo de dados que fora interrompido, e cujo dinheiro das 
apostas teria de ser dividido justamente de acordo com as probabilidades iguais de 
ganho de cada jogador, caso o jogo tivesse continuado até o final. A resposta fornecida 
por ambos ao problema de Gombaud revelou as regras matemáticas que subjazem 
aos jogos de azar, desenvolvendo a teoria da probabilidade que de um modo inde- 
pendente, outro genial matemático e famoso trapaceiro, o italiano Girolamo Cardano 
(1501-1576), havia iniciado antes. Contudo, a solução encontrada por Pascal e Fermat 
só foi publicada mais tarde através do primeiro livro exclusivo sobre teoria da proba- 
bilidade, chamado Sobre o Raciocínio em Jogos de Azar, do físico e astrônomo holandês 
Christian Huygens (1629-1695), lançado em 1657. Isso porque, na metade do século 
XVII, mesmo a matemática era considerada uma atividade amadora de eruditos que 





não deveria ter consequências sérias para as vidas dos demais mortais. 


Não obstante, além dos jogos de azar - dados e roleta -, que foram cruciais para 
o desdobramento da teoria da probabilidade, jogos de estratégia também são passí- 
veis de formalização matemática por intermédio de simplificações que permitem a 
simulação de cada tipo de jogo, constituído por regras bem definidas. Neste modelo 
estratégico, os jogadores não dependem apenas da sorte e precisam escolher, entre as 
alternativas disponíveis, qual a melhor linha de ação devem adotar para atingir um 
resultado esperado, tendo em mente o que a outra parte fará — como por exemplo, pô- 
quer e damas A Teoria dos Jogos trata, portanto, de sistematizar matematicamente, 
através dos modelos de jogos, as situações que envolvem duas ou mais pessoas, cujas 
decisões por uma estratégia de ação adequada influenciarão o resultado da interação e 
o comportamento subsequente das partes interessadas. 


Em 1730, a matemática já havia alcançado um respeito considerável, devido 
ao sucesso dos trabalhos do filósofo inglês Isaac Newton (1642-1727). Nesta época, o 
suíço Daniel Bernoulli (1700-1782), membro de uma ilustre família de matemáticos, 
já podia ser visto como um solucionador de problemas profissional, contratado para 
ensinar sua matéria em diversas cortes europeias. Em São Petersburgo, Rússia, ele 
pôde conceber a noção de utilidade como um valor de incremento inversamente pro- 
porcional à quantidade inicial. Isto é, tendo em vista o comportamento dos jogadores, 
haveria uma medida subjetiva de satisfação que explicaria a reação das pessoas em 
situações de risco, nos termos de maximização de sua utilidade. Circunstância que 
só dois séculos depois, receberia uma formulação moderna pela mão do matemático 
francês Emile Borel (1871-1956), na forma do teorema minimax. Usando a noção de 
estratégias mistas - que aplicam as estratégias puras a uma taxa de variação propor- 
cional aos ganhos -, em 1927, Borel conseguiu resolver jogos com duas pessoas que 
tivessem até cinco opções de estratégias a sua escolha. Uma solução geral, entretanto, 
só viria a ser alcançada pelo matemático húngaro John Von Neumann (1903-1957), em 
1928, consolidando as bases de uma moderna Teoria dos Jogos, na qual o conceito de 
utilidade é fundamental. 


Outro conceito chave dessa teoria começou a ser trabalhado pelo filósofo e eco- 
nomista francês Antoine Augustin Cournot (1801-1877). Em suas análises sobre os 
casos de duopólio, Cournot formalizou uma versão restrita do conceito de equilíbrio 
que iria ser generalizada, no século seguinte, por John Forbes Nash Jr. (1928-2015) 
em trabalhos que tornaram a Teoria dos Jogos pertinente a situações em que um lado 
pode vencer, sem precisar, necessariamente, derrotar o adversário. Cenários que filó- 
sofos como o inglês Thomas Hobbes (1588-1679), o escocês David Hume (1711-1776) 
e o suíço Jean-Jacques Rousseau (1712-1778) descreveram de modo intuitivo em suas 
respectivas obras: Leviatã (1651), Tratado da Natureza Humana (1739) e Discurso sobre 
a Origem e os Fundamentos da Desigualdade entre os Homens (1755). 


Hobbes descreveu, de modo bastante criativo, a solução cooperativa a qual po- 
dem chegar agentes racionais motivados apenas pela satisfação imediata de seus in- 
teresses, em conflito no estado de natureza. Dada a simetria e fragilidade de cada um 
dos que se enfrentam na natureza, apenas a busca da cooperação poderia atender os 
anseios de todos os envolvidos, preservando a paz necessária para realização de seus 
projetos pessoais. Contudo, de modo espontâneo, ninguém abriria mão de lutar pela 





posse de todos os meios indispensáveis para sua sobrevivência se seus potenciais rivais 
não fizessem o mesmo!. Hume, por sua vez, imaginou a situação vivida por dois fa- 
zendeiros que veem ameaçadas as suas safras pela dificuldade de convencerem um ao 
outro a colaborar nas suas respectivas colheitas, considerando que ambos são natural- 
mente egoístas e não nutrem simpatias mútuas”. Enquanto Rousseau imaginou o con- 
texto de caçadores que dependem da atuação de vários participantes, a fim de que se 
obtenha caça suficiente para todos, embora seja provável esperar a deserção daqueles 
que tenham a oportunidade de, individualmente, capturar uma presa menor, mas que 
os satisfizesse a ponto de estimular o abandono do grupo”. 


Inspirações como estas não são exclusivas da literatura moderna ou contempo- 
rânea, ou de uma concepção de indivíduo típica apenas da modernidade. No tempo 
em que Hammurabi (século XVIII a.C) reinava sobre toda Mesopotâmia, a coleção 
de sentenças que este rei babilônico mandou gravar em estelas de pedra negra e pu- 
blicar em frente a seus monumentos, a fim de difundir sua noção de direito, fundada 
na reciprocidade, que ainda hoje serve de lastro às leis contemporâneas. Suas célebres 


sentenças “olho por olho; dente por dente”! 


estão subjacentes às tradições judaicas, 
cristãs e todas as demais que propuseram variações da Regra de Ouro (“fazer ao outro 


o que se quer que faça a si mesmo”). 


Sobre outro aspecto, em 4 Vida dos Doze Césares (c. 120), Caio Suetônio Tran- 
quilo (69-141) narrou uma atitude que frequentemente Caio Júlio César (101-44 a.C.) 
tomava para evitar a deserção de seus soldados. César, quando pressentia que uma 
batalha seria difícil de prever a vitória, afugentava todos os cavalos, incluindo o seu 
próprio, com o objetivo de impedir a fuga dos menos corajosos, obrigando todos a luta- 
rem com afinco, já que não teriam outra opção disponível”. Solução semelhante a que 
Hernán Cortés (1485-1547) tomou quando fez destruir os barcos que poderiam servir 
de meio para fuga de seus soldados, antes da iniciativa de derrubar o império asteca, 
forçando os descontentes a se unirem a ele, pois estavam inferiorizados, em território 
hostil, sem qualquer outra saída. Porém, antes de todos, o estrategista chinês Sun Tzu 
(séc. V a.C.) já recomendava em seu manual 4 Arte da Guerra (500 a.C.): 


Lance suas tropas em situações das quais não há saída; seus 
homens preferirão enfrentar a morte a desertar. É, uma vez que 
estiverem prontos para morrer, você não poderá tirar menos do 


que o máximo de seus oficiais e soldados (SUN TZU. A Arte da 
Guerra, cap. 11, p. 91). 


Em ocasiões como estas, onde sempre pode haver conflito de interesses entre 
duas ou mais partes capazes de deliberarem sobre uma ação que implique numa reação 
recíproca consequente, a Teoria dos Jogos tenta encontrar uma formulação passível de 
ser tratada de modo tão rigoroso quando possível, com objetivo de apontar respostas 
factíveis. 


l Veja HOBBES, Th. Leviatã, I part. cap. XIV, pp. 18/9. 

2 Veja HUME, D. Treatise of Human Nature, III, part. II, seç. V, pp. 261/8. 

B) Veja ROUSSEAU, J. J. Discurso sobre a Origem e os Fundamentos da Desigualdade entre os Homens, 
II part., p. 261. 

4 Veja BOUZON, E. O Código de Hamurabi, à 196 a à 200, pp. 181/2. 

5 Veja SUETÔNIO TRANQUILO, C. A Vida dos Doze Césares, p. 38. 








Teorias Concorrentes 
Até que John von Neumann e Oskar Morgenstern (1902-1977) publicassem o 


livro que deu origem a esse novo ramo da matemática, diversos outros economistas e 
matemáticos, além dos já mencionados, contribuíram com conceitos e teoremas que 
mais tarde foram incorporados, como por exemplo a regra de Thomas Bayes (1702- 
1761) para calcular a probabilidade de um evento ocorrer a partir de uma informação 
dada e o teorema de Ernst Zermelo (1871-1953) sobre a existência de uma estratégia 
vitoriosa em jogos de informação perfeita e soma zero (em que um só ganha se outro 
perde). Essa distribuição inicial dos conceitos espalhada por vários países e autores ao 
longo da história moderna dificultou a identificação de um marco histórico nítido para 
fundação da Teoria dos Jogos. 


Os quatro artigos que Borel publicou no início do século passado, introduzindo 
a noção de estratégias mistas e solução minimax, serviram então para reivindicação 
desta prerrogativa, por parte de autores franceses, em favor de seu ilustre compatrio- 
ta”. Não obstante, o polímata Herbert Alexander Simon (1916-2001), por sua vez, 
embora tenha preparado a versão preliminar de seu Comportamento Administrativo 
(1945) antes de surgir Theory of Games and Economic Behavior (Teoria dos Jogos e do 
Comportamento Econômico, 1944), abriu mão de qualquer mérito de ter descoberto um 
novo conceito de jogos estratégicos, abordado em seu livro sob a ótica do homem admi- 
nistrativo, ao invés do homem econômico enfocado por von Neumann e Morgenstern. 


Na versão de Simon, o caráter administrador procuraria “contemporizar” ao 
invés de “maximizar”, (...) [realizando] suas escolhas sem precisar examinar previa- 
mente todas as possíveis alternativas de comportamento, e sem ter de certificar-se de 
que essas são de fato todas as alternativas que se lhe oferecem””. Se a versão do homem 
administrativo, lançada por Simon tivesse prevalecido, não seria necessário levar em 
conta todas as relações dos objetos envolvidos para deliberação, como quer a Teoria 
dos Jogos. Bastaria apenas o apoio regras empíricas simples que não sobrecarregassem 
o cálculo para uma escolha razoável, ao invés de uma forte formação matemática que, 
por vezes, é alvo de críticas de psicólogos e antropólogos. 


Para a Teoria dos Jogos que prevaleceu, entretanto, todo processo de delibera- 
ção parte da noção de um agente cuja racionalidade instrumental mínima, típica do 
homem econômico, visa tão somente maximizar os ganhos de seus esforços, encarando 
o mundo real em toda sua complexidade de relacionamento. Em Theory of Games and 
Economic Behavior, von Neumann e Morgenstern estabeleceram, como parâmetros de 
sua teoria, os jogos de duas pessoas com soma zero, em geral, e jogos cooperativos, 
isto é, quando jogados com mais de dois jogadores e com a permissão de transferência 
de utilidade interna às coalizões que forem constituídas. Por conta disso, produziram 
uma consistente axiomatização da teoria da utilidade que foi amplamente aplicada 
nos diversos domínios econômicos e fora destes. 


No entanto, por mais inspirada e detalhada que fosse a prova do teorema mini- 
max e a formalização dos jogos de soma zero, a Teoria dos Jogos surgiu incompleta, 
ao deixar em segundo plano os jogos de soma variável e os não-cooperativos. Cedo, 


6 Em Games and Decisions, Luce e Raiffa citam o economista Maurice Fréchet como um dos autores desta proposta. 
Veja LUCE, R.D. & RAIFFA, H. Games and Decisions, cap. 1, p. 2. 
1 SIMON, H. A. Comportamento Administrativo, pp. XXVII-XXIX. 





matemáticos brilhantes trabalharam para preencher as lacunas deixadas. John Nash 


procurou generalizar o teorema de minimax de von Neumann para todo tipo de jogo 
- soma zero ou variável, com n-pessoas. À solução encontrada foi batizada de “ponto 
de equilíbrio”, como se fosse um repouso natural nas ocasiões em que nenhum jogador 
poderia melhorar sua posição, mudando de estratégia, sem que piorasse os resultados 
dos demais envolvidos. Nash conseguiu provar que, para qualquer tipo de jogo, existe 
pelo menos um ponto de equilíbrio que pode ser encontrado usando estratégias mistas, 
como uma variação na proporção em que são aplicadas as estratégias originais, puras. 
Com isso, ao lado do teorema minimax, o equilíbrio de Nash tornou-se um dos alicer- 
ces fundamentais da Teoria dos Jogos, pois permitiu que os jogos não-cooperativos, 
que envolvem cooperação e competição pudessem ser tratados, além dos chamados 
cooperativos - aqueles em que os jogadores podem usar a comunicação e fazer acordos 
que forcem a colaboração dos demais. 


A elegância e precisão das provas matemáticas de von Neumann e Nash, apesar 
de formarem uma base teórica sólida, não impediram os pesquisadores interessados 
em obter contraexemplos que consolidassem a Teoria dos Jogos, a prepararem expe- 
rimentos laboratoriais que pudessem ou não confirmar na prática aquelas teses duras 
acerca da racionalidade dos agentes. Em janeiro de 1950, os laboratórios da corpora- 
ção estadunidense Rand tinham em seus quadros matemáticos astutos do porte de 
Melvin Dresher (1911-1992) e Merrill Meeks Flood (1908-1991) que prepararam uma 
experiência que se tornou histórica, a fim de verificar se pessoas de “carne e osso” se- 
riam capazes de encontrar as estratégias em equilíbrio previstas pela teoria. Por cem 
vezes, realizaram os testes com a participação do matemático John Davis Williams 
(1909-1964), chefe de departamento da Rand, e do economista Armen Albert Alchian 
(1914-2013), da University of California, Los Angeles (UCLA), que interagiam entre 
si. Entretanto, em vez de buscarem suas estratégias dominantes e pararem num ponto 
de equilíbrio, eles optaram por cooperar mais vezes, do que trair o outro. Este famoso 
experimento ficou conhecido, depois, como Dilema dos Prisioneiros, graças à história 
contada pelo canadense Albert William Tucker (1905-1995) - que fora orientador de 
Nash -em um seminário para psicólogos, na Universidade de Stanfordº. 


Na concepção de Tucker, dois suspeitos de terem cometido um crime grave são 
presos e interrogados separadamente. Na tentativa de incriminá-los, o inspetor encar- 
regado da investigação, de modo reservado, oferece a cada um as opções de confessar o 
delito e entregar o comparsa, ou ficar calado. Caso um dos suspeitos denunciasse o ou- 
tro que ficasse calado, o denunciante obteria a liberdade, por colaborar com a justiça, 
enquanto seu colega arcaria sozinho com a pena máxima. Se ambos permanecessem 
em silêncio, pegariam uma sentença mais branda pelo crime leve que os levaram à pri- 
são em flagrante. Contudo, se os dois se delatassem mutuamente seriam punidos com 
uma mesma condenação: menor do que a máxima, mas maior do que a pena leve. Por 
conta disto, a única estratégia que domina todas as outras é a da confissão mútua, uma 
vez que, independente da reação do outro, o melhor que cada um faria por si mesmo 
é confessar o crime grave, ao contrário de se expor à possibilidade de ficar mais tempo 
na cadeia pagando a maior pena. Tal previsão, contradita pela experiência na Rand, 
mostrava a existência de algum problema no tipo de racionalidade concebida, pois, em 


vez de buscar resultados mais favoráveis para si, os jogadores tendiam a escolher a co- 


8 Veja NASAR, S. Uma Mente Brilhante, cap. 12, p. 141. 








operação para maximizar seus ganhos, sem buscar, aparentemente, o equilíbrio Nash. 
Ao saber disso, Nash atribuiu a falha na experiência ao fato dos jogadores interagirem 
em “um grande jogo de movimentos múltiplos”, lamentando a ineficiência deles em 
comportarem-se mais racionalmente”. 


Por outro lado, o conceito de utilidade - que não é exclusivo da Teoria dos Jogos, 
mas pertence ao domínio próprio da economia - foi alvo de fortes questionamentos em 
dois aspectos: primeiro, devido a suposta impossibilidade de se medir coisas incomen- 
suráveis; depois, pela duvidosa manutenção de uma racionalidade capaz de preservar 
a intransitividade e substituição das preferências, bem como a atenção às probabili- 
dades objetivas em detrimento das subjetivas. O economista francês Maurice Félix 
Charles Allais (1911-2010), em seu artigo “Le Comportement de [Homme Rationnel 
Devant Le Risque” (O Comportamento do Homem Racional diante do Risco, 1953), ata- 
cou a manutenção rígida do conceito de racionalidade para todo tipo de situação. Em 
sua pesquisa, Allais constatou que, diante do risco e ou incerteza, os agentes racionais 
assumiam uma perspectiva subjetiva da probabilidade de um evento acontecer, sem 
atentar para estatísticas objetivas. Além do mais, não preservavam a independência 
de suas escolhas, quando na substituição de alternativas irrelevantes. Fatores psicoló- 
gicos que influenciavam decisivamente os processos deliberativos, virtualmente, impe- 
diam qualquer tentativa de formalização. 


Em verdade, as críticas relevantes de Allais, embora fossem direcionadas à noção 
de utilidade adotada pela teoria econômica estadunidense, atingiram também a Teoria 
dos Jogos, que tem elementos comuns a esta. Nesse contexto, os ataques diretos que 
a Teoria dos Jogos começava a receber, em parte, arrefeceram o entusiasmo inicial da 
primeira metade do século XX. Testes empíricos mostravam que aspectos psicológicos 
impunham algumas restrições e exigiam novas técnicas de abordagem aos especialis- 
tas. 


Limites e Superação 

Enquanto problemas práticos persistiam, outros autores ajudavam a desenvol- 
ver e aplicar a Teoria dos Jogos em diversos setores do conhecimento. Em 1955, Ri- 
chard Bevan Braithwaite (1900-1990) lançou o primeiro livro de filosofia a tratar desta 
teoria, chamado Theory of Games as a Tool for the Moral Philosopher (Teoria dos Jogos 
como uma Ferramenta para o Filósofo Moral), onde propôs um princípio equitativo, 
segundo orientação fornecida por uma “fronteira de eficiência”. Anos depois, outros 
filósofos, como o canadense David Gauthier que desenvolveu toda uma teoria contra- 
tualista da moral fundada na Teoria dos Jogos, em Morals by Agreement (Moral por 
Acordos, 1986), reconheceram o novo instrumento de análise que lhes surgia. Martin 
Hollis (1938-1998), por sua vez, com o auxílio da Teoria dos Jogos procurou atacar a 
noção limitada que vê a razão instrumental incompatível com a confiança, buscando 
na reciprocidade e no bem comum as bases iluministas de racionalidade e identidade 
comprometidas com o relacionamento local e o universalizável!º. 


Nos anos que se seguiram à II Guerra Mundial, os modelos matemáticos de jo- 
gos serviram de orientação para o desenvolvimento e teste de estratégias militares 


9 NESAR, S. Op. cit, cap. 13, p. 149. 
10 Veja HOLLIS, M. Trust within Reason, cap.8, p. 162. 





empregadas durante a Guerra Fria. O que fez com que Von Neumann e outros “teó- 
ricos dos jogos” inspirassem o caricato personagem principal do filme Dr. Strangelove 
(Dr. Fantástico, 1963), de Stanley Kubrick (1928-1999), interpretado por Peter Sellers 
(1925-1980). O apelo antimilitarista da maioria da população mundial, naquela épo- 
ca, somado aos problemas inerentes à teoria emergente, mas incompleta, lançou uma 
sombra sobre os propósitos nebulosos dos pesquisadores desta área. 


Apesar de sua “má fama”, diversos novos conceitos foram criados no sentido de 
aproximar a teoria da realidade vivida pelas pessoas nos seus conflitos cotidianos. Es- 
tudos de jogos repetitivos, com várias rodadas seguidas; estocásticos, cujos pagamen- 
tos sofrem variação numa porcentagem fixa; novos modelos de jogos, como a Batalha 
dos Sexos; e as representações de jogos na forma extensiva, de árvores com nós e ramos 
que esquematizam os movimentos tomados, e estratégica, com matrizes onde figuram a 
lista de estratégias de cada jogador e seus resultados cruzados em células individuais, 
são alguns exemplos dos muitos aspectos desenvolvidos depois de 1950. Em 1960, Tho- 
mas Cromble Schelling descreveu os efeitos da comunicação implícita e do chamado 
ponto focal para deliberação em jogos de motivação mista, intermediários à competição 
irrestrita e à pura colaboração. Mais uma vez, destacou-se os aspectos psicológicos 
e culturais que não eram passíveis de uma abordagem meramente matemática. Ao 
longo dessa década, outros dois autores - que, em 1994, dividiriam o prêmio Nobel 
de economia com John Nash -, Reinhard Justus Reginald Selten (1930-2016) e John 
Charles Harsanyi (1920-2000), propuseram, respectivamente, o conceito de perfeito 
equilíbrio de subjogo como refinamento do equilíbrio de Nash e uma distinção precisa 
dos compromissos, onde eles são obrigatórios e quando não são plenamente factíveis; 
bem como a teoria dos jogos de informação incompleta, para jogadores que têm de se 
valer da probabilidade, a fim de encontrarem uma solução. 


Em 1972, John Maynard Smith (1920-2004), biólogo evolucionista inglês, intro- 
duz a ideia de estratégias evolutivamente estáveis (EEE, ou ESS, sigla de evolutiona- 
rily stable strategy) em uma teoria dos jogos evolucionários que transformou a biologia 
em uma das disciplinas que mais empregam a teoria dos jogos na análise dos proble- 
mas trabalhados. Em 1979, Daniel Kahneman - psicólogo israelense que ganhou o prê- 
mio Nobel de economia de 2002 -, ao lado de seu colega e compatriota, Amos Tversky 
(1937-1996), publicou a Teoria das Perspectivas (Prospect Theory) como uma resposta 
aos desafios e críticas feitos por Allais, anos antes, sobre as condições psicológicas dos 
conceitos de utilidade e racionalidade adotados pela Teoria dos Jogos. 


Os problemas que Nash havia percebido nos jogos repetidos foram aprofundados 
na teoria de Maynard Smith, cujo principal livro, Evolution and the Theory of Games 
(Evolução e Teoria dos Jogos), fora lançado em 1982, e na Teoria da Cooperação de 
Robert Axelrod, iniciada em 1984 no seu The Evolution of Cooperation (A Evolução 
da Cooperação). Daí em diante, a Teoria dos Jogos deixa de ser assunto exclusivo de 
economistas e matemáticos, passando a ser discutida abertamente por cientistas das 
mais diversas áreas do conhecimento. A biologia evolutiva destacou-se, mas também a 
psicologia, a neurologia e alguns filósofos mais avançados foram atraídos pelos jogos e 
sua capacidade de modelar o comportamento de agentes (racionais ou não) envolvidos 
numa interação e interessados nos resultados que os favoreçam preferencialmente. 


Muitas correntes, além daquelas apontadas aqui, derivaram da Teoria dos Jogos 








e não é exagero dizer que milhares de artigos nos mais diversos campos têm sido pu- 


blicados todos os anos. Depois que Axelrod popularizou os torneios com simulações de 
estratégias para o Dilema do Prisioneiro Iterado (DPI), uma nova abordagem comple- 
tamente diferente da tradição filosófica surgiu para avaliar a cooperação e o modo de 
interação entre agentes com um grau mínimo de racionalidade. Desde então, começou- 
se analisar como a cooperação, paradoxalmente, poderia emergir mesmo entre sujeitos 
egoístas, interessados, primeiro, em satisfazer seus desejos imediatos de sobreviver e 
reproduzir. 


Qualquer que fosse o cenário, determinista ou indeterminista, simultâneo ou al- 
ternado, se constatou que o entendimento mútuo poderia ocorrer, desde que aplicada 
a estratégia adequada para cada situação. Outros modelos de jogos criados mostraram 
isso mais de perto. No jogo conhecido como Ultimato, pode-se perceber com nitidez a 
necessidade da atuação do comportamento equitativo para a solução alcançada. Nou- 
tro modelo, chamado de Bens Públicos, o papel da punição e de um agente institu- 
cional são detectados no sentido de fazer valer os compromissos estabelecidos. A tais 
atributos - equidade e função do Estado -, que são centrais na filosofia política e na 
ética, acrescenta-se ainda o elemento discursivo, que em alguns jogos falados, não coo- 
perativos, podem refinar a solução, quando vários equilíbrios são acessíveis. 


A simulação por meio de jogos tornou-se ainda um elemento essencial no de- 
senvolvimento de um programa de pesquisa, chamado Vida Artificial, que amplia as 
fronteiras da Inteligência Artificial a todo sistema de interação dos seres vivos. Do 
comportamento dos vírus a grandes impérios da história, o ciclo de “origem-escalada 
-apogeu-declínio” é reproduzido várias vezes em computadores, com objetivo de des- 
vendar o programa que subjaz à evolução, de um modo geral. Tamanha diversidade de 
aplicações impede que o assunto tratado adote uma postura exaustiva e detalhada que 
mereceria o fenômeno interdisciplinar da Teoria dos Jogos. De acordo com os propósi- 
tos adotados, pretende-se enfatizar a apresentação nos conceitos e princípios básicos 
da Teoria dos Jogos e da Cooperação, nos pontos de interesse direto aos filósofos prá- 
ticos (ética e política), destacando, no início, o papel da comunicação e, em seguida, o 
método da simulação, os jogos onde emerge a equidade e o papel de instituições, como 
o Estado. 


$1. A Estrutura do Jogo: Conceitos e princípios 


A palavra “jogo”, que dá nome à teoria, foi alvo de diversos mal-entendidos des- 
necessários. Muitos consideravam a Teoria dos Jogos como algo frívolo, pouco sério, 
ou simplesmente não-científico, dada sua origem em estudos de jogos de salão, como 
pôquer, xadrez ou “pedra, papel e tesoura”. Por ter sido gerada num ambiente predo- 
minante masculino e antes dos movimentos sociais exigirem do mundo acadêmico a 
colocação de expressões “politicamente corretas”, a teoria está povoada por conceitos 
cujos termos fazem referências à “batalha dos sexos”, “conversa barata” (cheap talk), 
“blefe” e “pato” (sucker), entre outros jargões menos chocantes. Tecnicamente, no en- 
tanto, essa má impressão se desfaz quando se percebe que a aparente simplificação das 
relações entre indivíduos fornecida pela formalização matemática da teoria permite 
analisar com uma precisão até então desconhecida nas ciências sociais o comporta- 


mento dos agentes “racionais”, humanos ou não. 








Para a Teoria dos Jogos, um jogo é definido por um conjunto de regras que esta- 
belece seus cinco elementos constitutivos”: 


« o número de participantes; 
. as ações ou estratégias possíveis; 
. os resultados de cada jogador; 


.« a função que permite a cada parte combinar suas estratégias e 


QN 


. a relação de preferências de cada um diante dos resultados. 


Além disso, as regras delimitam o grau de informação permitido aos agentes. Os 
Jogos são representações simplificadas de situações onde pelo menos uma pessoa age no 
sentido de maximizar a utilidade de suas ações levando em conta as reações de outros 
agentes. Trata-se, portanto, da descrição formal de uma situação interativa estraté- 
gica em que as partes devem resolver qual a melhor decisão a ser tomada, segundo o 
ponto de vista de um agente capaz de computar quais meios serão necessários para 
obtenção do fim esperado. Por conseguinte, um jogador possui como requisito mínimo 
uma racionalidade instrumental ou estratégica. 

Jogos com apenas uma pessoa são considerados jogos contra a natureza (ou Sor- 
te) - único agente considerado não-racional, mas que pode gerar indeterminação aos 
resultados, que passam a ser influenciados pela lei da probabilidade. A rigor, não há 
empecilhos formais para o estudo de jogos com um número infinito de participantes, 
embora seja mais frequente a pesquisa dos casos que envolvem duas partes, cuja vi- 
sualização pode ser feita facilmente na forma dita normal, ou estratégica, e na forma 
extensiva. Na sua representação normal, os jogos são exibidos em matrizes nas quais 
as estratégias de cada jogador são listadas respectivamente nas linhas e colunas. Em 
cada célula da tabela, aparecem os ganhos que cada uma das partes obterá caso realize 
as ações às quais ambas estão vinculadas. Os ganhos do jogador da linha são grafados 
na primeira posição, à esquerda do par ordenado, e os do jogador da coluna vêm após 
a vírgula que os separa, à direita. A figura 1.1 traz a tabela geral da forma estratégica. 


Figura 1.1 Matriz Geral de Estratégias Puras 
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1 Para um jogo de forma normal, ou estratégica, apenas os três primeiros elementos são necessários à definição, mas 
para jogos não cooperativos os dois últimos itens são relevantes, com ensina WERLANG, S.R.da C. “Jogos de Informação 
Incompleta”, p. 2. 








As matrizes são tabelas que servem para apresentar de forma compacta as res- 


postas que podem ser esperadas em função das ações escolhidas simultaneamente. 
Aqui a ordem em que os jogadores atuam é irrelevante ao resultado. Também é des- 
considerada a quantidade de vezes que os jogos se repetem, sendo a síntese de todos 
jogos possíveis em suas rodadas infinitas, ou indeterminadas. A matriz concentra as 
informações disponíveis a cada jogador por igual. Por outro lado, dificulta a inclusão 
de um número muito grande de jogadores. Acima de dois jogadores, a representação 
deixa de ser bidimensional e passa a ser tridimensional, com três participantes, ou 
multidimensional, para mais de quatro jogadores. 


Jogos em que os detalhes omitidos pela forma estratégica são relevantes ficam 
melhor representados na descrição completa fornecida pela forma extensiva, desenha- 
da no modelo estrutural de “árvores”. No esquema de árvores, a ordem deliberativa 
de cada jogador é observada, bem como o conjunto de informações de cada um. Os 
pontos apresentados - ou “nós” - são as decisões disponíveis e os traços - ou “ramos” 
- as alternativas de movimento e as ações que levam de um nó a outro, desde o ponto 
inicial - ou “raiz” - até o resultado final em cada terminal — ou “folha”. O caminho 
traçado, da raiz à folha, delineia todas as estratégias que podem ser realizadas. Moti- 
vo pelo qual as árvores só devem ser empregadas em jogos finitos. A forma extensiva 
permite uma análise direta da situação, já que apresenta toda estrutura das jogadas e 
das informações disponíveis de uma vez. Observando os nós e ramos da árvore, podem 
ser percebidos o número de jogadores, suas opções nos pontos de decisão, as posições 
intermediárias - ou movimentos - até os pontos terminais e a quantidade de jogadas a 
cada passo executado?. O conjunto de informação de cada jogador é limitado em cada 
rodada por uma linha que circunda os nós de decisão. Quando o jogador tem certeza 
em qual nó se encontra, este conjunto de informação é unitário. Cada nó e conjunto 
de informação são rotulados com o número ou letra de cada jogador, enquanto os ra- 
mos são rotulados com as alternativas de ação que partem de cada nó. As árvores são 
apropriadas para os jogos sequenciais, onde os agentes se movimentam numa ordem 


predeterminada (figura 1.2). 


No exemplo da figura 1.2, vê-se a raiz, representada pelo ponto aberto “a”, cor- 
responder ao conjunto unitário de informação inicial do jogador 1, que tem duas linhas 
de ação a sua escolha, 1 ou 2. O jogador II deverá na sequência escolher também entre 
suas opções 1 ou 2. Contudo, dependendo do nó em que se localize, “b” ou “c”, pode- 
rá levar com que a natureza, jogador 0, venha executar o próximo movimento, caso 
sua alternativa 1 seja adotada a partir do nó “b”. Assim, haveria a probabilidade dos 
resultados de “R/” a “R,”, ocorrerem nas proporções que nomeiam seus respectivos 
ramos. De outro modo, se II selecionasse a estratégia 2, desde o ponto de decisão “c”, o 
jogador III entraria em cena para optar por uma de suas três ações que conduzem aos 
ganhos de “R ” a “R ”. Do contrário, as demais alternativas retornam a | a chance de 
escolher entre “R ” e “R”, decidindo a partir de “e”, ou “R” e “R”, saindo de “f”. 
Todos os dez resultados possíveis deste exemplo distribuiriam, ao final, os pagamentos 
devidos aos três jogadores envolvidos (LI, II, III), já que a natureza (0), embora possa 
atuar como um agente irracional gerador de incerteza, não obtém nenhum ganho das 


ações empreitadas. 


l2 Veja SHUBIK, M. Teoría de Juegos en las Ciencias Sociales, II1.3.1 a 111.3.3, pp. 48-53. 





Figura 1.2: Forma Extensiva - Esquema de Árvore de Kuhn 





A definição mais geral da forma extensiva para jogos com n-pessoas foi estabele- 
cida por Harold William Kuhn (1925-2014), em 1953, no artigo “Extensive Games and 
the Problem of Information” (“Jogos Extensivos eo Problema da Informação”), amplian- 
do a versão apresentada por John von Neumann, em 1928. A chamada árvore de Kuhn 
atende a sete condições: 


1 Um conjunto de n jogadores; 
ii. Estrutura de árvore enraizada, chamada árvore do jogo; 
ii. Partição do conjunto de nós em diversos subconjuntos, entre os jogadores; 


iv. Distribuição de probabilidade rotulando cada ramo brotado de um nó do sub- 
conjunto da natureza, jogador 0; 


v. À formação de conjunto de informações para cada subconjunto de nós de um 
jogador deve respeitar (a) o mesmo número de ramos correspondentes, saindo de 
cada nó diferente, e (b) cada caminho, partindo da raiz à folha, só pode cruzar 
um conjunto de informação uma única vez; 


vi. Cada folha contém, ao final, os pagamentos resultantes a cada jogador; 


vii. E, por fim, a descrição completa da árvore é de conhecimento comum a todos 
jogadores. Ou seja, cada um sabe o que os outros também sabem. 


Tantos os jogos cooperativos como os não-cooperativos - duas das principais di- 
visões dos modelos de jogos teóricos que são abordadas a seguir - podem ocorrer em 
condições cujas tomadas de decisões dos participantes são feitas simultaneamente, em 
sequência ou a cada vez que os jogos são repetidos. Os jogos simultâneos são aqueles 
em que as escolhas das estratégias acontecem ao mesmo tempo, sendo, de preferência, 
representados por matrizes. Quando a ordem de atuação influencia o seu desenvolvi- 
mento, os jogos são chamados sequenciais. Nos jogos sequenciais finitos, a melhor for- 
ma de representação se dá por meio do esquema de árvores. Por fim, os jogos repetidos 
exigem que as mesmas opções de estratégias sejam exibidas em rodadas sucessivas, nas 


13 Veja HART, $. “Games in Extensive and Strategic Forms”, in AUMANN, R. & HART, $. Handbook of Game 
Theory with Economic Application, vol. 1, cap. 2, 8 1, pp. 22/5. 








quais os jogadores têm de decidir novamente se mantêm suas escolhas anteriores ou 


trocam de alternativa. À iteração que ocorre nesse último tipo de jogo faz surgir mistu- 
ras de estratégias que não poderiam levar a uma solução equilibrada, quando jogadas 
de uma única vez, na condição pura do jogo base apresentado na primeira rodada. Jo- 
gos repetitivos também são chamados de superjogos. Nos superjogos, a memória exerce 
um papel crucial na construção de um equilíbrio que se torna muito difícil quando as 
ações dos jogadores não são plenamente recordadas ou são perturbadas pelo acaso. Os 
superjogos servem de base aos modelos de simulação utilizados em larga escala pela 
biologia, ciência da computação e demais disciplinas. 


Informações 


Conforme a possibilidade ou não de comunicação e a quantidade de informação 
acessível, os jogos podem ser divididos em cooperativos ou não-cooperativos, de infor- 
mação completa ou incompleta, perfeita ou imperfeita. Jogos cooperativos são aqueles 
em que a comunicação prévia é permitida entre os jogadores, antes de decidirem a 
estratégia que adotarão durante o jogo. Com isso, acordos irrevogáveis e automotivan- 
tes são passíveis de estabelecimento. Para ser eficaz, a comunicação precisa ser livre 
de distorção e sem qualquer custo para os falantes, isto é, a emissão de mensagens 
não implica em uma alteração direta da matriz original do jogo. Entretanto, embora 
a comunicação, à primeira vista, pareça facilitar a realização de contratos, também 
abre espaço para imposição de coalizões, ameaças e blefes que perturbam a produção 
dos melhores resultados para uma das partes. Uma visão mais abrangente do papel 
da comunicação será discutida de perto no próximo capítulo, dedicado a esse tema 
importante para a Teoria dos Jogos. 


Jogos não-cooperativos proíbem que a comunicação prévia seja estabelecida, ape- 
sar de haver situações em que a sinalização acontece, bem como o encontro de conven- 
ções que ajudam a coordenar as ações dos agentes, com base no conhecimento comum 
partilhado pela cultura, convívio social ou capacidade cognitiva dos jogadores. Nestas 
ocasiões, um efeito chamado de “telepatia” emerge como forma de comunicação implí- 
cita entre falantes de uma mesma língua ou habitantes de uma mesma região ou grupo 
social, dotados de mentes semelhantes e conhecimento comum. 


De todo modo, sendo ou não implementada a comunicação, quando os jogadores 
têm pleno conhecimento do número de participantes, da posição que cada um ocupa 
em cada etapa do jogo e dos resultados que todos podem obter, diz-se que o jogo é de 
informação completa. Na falta de um desses elementos informativos, o jogo é de infor- 
mação incompleta e as características sobre o tipo dos jogadores deixam de ser de co- 
nhecimento comum, quebrando a simetria entre eles. Em jogos de informação perfeita, 
por meio de indução reversa, os jogadores podem conhecer toda história do jogo, antes 
mesmo de tomarem suas decisões. Todos os conjuntos de informação de uma árvore 
de jogo de informação perfeita são unitários. O que vale dizer que cada parte sabe em 
qual nó de um jogo sequencial está. Caso contrário, o jogo é chamado de informação 
imperfeita. Os participantes que se lembram, a cada rodada, de todos os lances ante- 
riores efetuados desde o início do jogo possuem memória perfeita, enquanto os jogos 
em que não é possível ter toda essa informação do passado são chamados de memória 


imperfeita. 








Uma maneira de trabalhar a falta de informação na modelagem dos jogos é in- 
troduzir a natureza como uma parte atuante em alguma jogada. Assim, as incerte- 
zas dos demais jogadores, em relação à definição das regras, podem ser interpretadas 
como probabilidades subjetivas, que a psicologia dos jogadores trata de estabelecer. 
Em diversos textos do final dos anos 1960 - onde se destaca “Games with Incomplete 
Information Played by 'Bayesian” Players” (“Jogos com Informação Incompleta Jogados 
por “Bayesianos””, 1967-68) -, John Harsanyi sistematizou essa situação tratando os 
agentes como jogadores “bayesianos”, isto é, aqueles cujas incertezas podem ser ope- 
radas através de uma distribuição da probabilidade subjetiva conjunta partilhada por 
todos!!. Embora a aplicação destas ideias seja difícil de ser observada por humanos e 
outros animais no seu dia a dia, o modelo de Harsanyi serviu para descrever as circuns- 
tâncias em que a informação é assimétrica, quando alguém dispõe de conhecimento pri- 
vilegiado sobre os ingredientes do jogo que não é de domínio dos outros envolvidos na 
mesma situação dos jogos chamados de informação incompleta. De uma certa forma, 
também foi uma resposta à proposta feita por Thomas Schelling no segundo apêndice 
de The Strategy of Conflict (A Estratégia do Conflito) para o abandono da simetria na 
Teoria dos Jogos. A adoção desta sugestão trazia algumas dificuldades para a teoria, 
uma vez que o equilíbrio de Nash tinha como condição a simetria entre os jogadores, 
apesar da maioria dos casos interessantes envolverem movimentos assimétricos. À so- 
lução de Harsanyi produziu, então, equilíbrios Bayes-Nash para cada tipo de jogador 
que maximiza os valores esperados de acordo com as estratégias seguidas pelos outros, 
subentendendo a incerteza quanto ao tipo do outro jogador, que pode ser diferente 
tendo em vista a crença subjetiva na probabilidade prévia de distribuição desses tipos 
na natureza”. A crença prévia comum é a expectativa que todos jogadores têm sobre o 
modo da natureza produzir alternativas de forma aleatória. Tal crença nada mais é, 
portanto, que o conhecimento comum da probabilidade estimada de que um tipo de 
jogador venha fazer parte do jogo. De posse dessas informações os jogadores podem 
avaliar suas escolhas a partir de probabilidades predeterminadas de que esteja enfren- 
tando um tipo diferente ou semelhante de respectivos oponentes. Toda essa discussão, 
entretanto, depende da maneira que a comunicação é tratada, tema que será mais 
desenvolvido, como já foi prometido, no segundo capítulo. 


Soma Zero ou Variável 


Jogos não-cooperativos incluem, entre outras, uma categoria de confronto de 
interesses que é definida como estritamente competitiva. São situações extremas nas 
quais para um jogador ganhar, o outro tem necessariamente de perder, ou então as 
partes terminam o jogo sem saldo algum. Nos assim chamados jogos de soma zero, não 
há possibilidade de cooperação entre dois agentes egoístas, já que seus interesses são 


l4 Harsanyi aplicou em três artigos sucessivos chamados “Game with Incomplete Information Played by 
“Bayesian”' Players” a estatística bayesiana em jogos em que os participantes não são totalmente informados e têm in- 
certeza quanto aos resultados obtidos, com intuito de achar uma solução racional para esses casos. K contribuição de Thomas 
Bayes (1702-1761), neste caso, resume-se ao seu método de encontrar a probabilidade de ocorrência de determinadas causas, 
antes do evento qualquer ser observado. Pelo teorema de Bayes, a probabilidade (P) de uma hipótese (h), ou informação, dada 
a sua evidência (e), ou evento, é igual ao produto das probabilidades da hipótese e da evidência dividida pela hipótese, sendo 
o resultado uma fração da probabilidade da evidência, ou P(hle) = [P(h) x P(e/h)] — P(e). À fórmula de Bayes é um método 
algébrico útil para determinação dos valores quando o esquema de árvore tem muitas alternativas que tornam sua construção 
muito complexa. 

15 Veja SCHELLING, Th. €. The Strategy of Conflict, ap. B, pp. 211 e ss; VARIAN, H. R. Intermediate Microeco- 
nomics, cap. 15, 49 15.12-13, pp. 219/82 e FIANI, R. Teoria dos Jogos, cap. 7, pp. 175 e ss. para introdução ao assunto. 








totalmente opostos. Contudo, com mais de duas pessoas, coalizões de jogadores podem 
ser formadas contra a outra parte, motivo pelo qual os jogos passam a ser considerados 
cooperativos, admitindo a influência da comunicação prévia. Não obstante, a soma 
dos resultados de todos os jogadores envolvidos nessa interação é sempre igual a zero. 
Na matriz de jogos de duas pessoas e soma zero, por convenção omitem-se os ganhos 
relativos à coluna, que passam a ser inferidos a partir do resultado expresso para a 
linha, multiplicado por menos um (figura 1.3). 


Figura 1.3 Jogo de Soma Zero 
Coluna 


Estratégias Pedra Tesoura 





De acordo com o teorema de Zermelo, publicado em 1913, no artigo “Uber eine 


Anwendung der Mengenlehre auf die Theorie des Schachspiels” (Sobre uma Aplicação da 
Doutrina Mista à Teoria do Jogo de Xadrez), jogos finitos de soma zero com informação 
perfeita são estritamente determinados. Qualquer um dos jogadores tem a sua disposi- 
ção uma estratégia capaz de garantir a vitória, ou ao menos o empate, a despeito de 
como o adversário atuará. Tal pressuposto pode ser demonstrado por contradição: ao 
admitir-se que um jogo soma zero finito, com informação perfeita, não é estritamente 
determinado, deve-se supor que nenhum jogador possui uma linha de ação que, desde 
o início do jogo lhe traga a vitória, pois, do contrário, o oponente não poderia encon- 
trar outra que o permitisse vencer. Assim, o primeiro lance do jogo não será uma po- 
sição vitoriosa, qualquer que seja a posição inicial. Caso houvesse, o primeiro jogador 
mover-se-ia imediatamente para lá. Além disso, tal posição também não será vitoriosa 
para o adversário, pois se fosse assim teria desde o início condições de ganhar o jogo. 


Por conseguinte, se a primeira jogada não assegura vitória, a segunda também 
não a garante, muito menos as demais, até o infinito. Contudo, se o jogo é finito, tem 
de haver uma posição final, na qual um dos jogadores alcance a vitória ou o empate. 
Logo, a condição da finitude do jogo contradiz a afirmação de que o jogo não é estrita- 
mente determinado, demonstrando, então, a validade do Teorema!*. 


Pedra, Papel ou Tesoura não é um jogo estritamente determinado por ser simul- 
tâneo e, portanto, de informação imperfeita, pois, qualquer estratégia que venha a ser 
adotada pode ser vencida por uma outra adequada do adversário”. Ambos escolhem 
suas ações ao mesmo tempo, sem saber qual será a decisão do outro, o que torna im- 
possível uma solução usando apenas as estratégias puras. Não há, como se verá mais 


16 Veja DAVIS, M. Teoria dos Jogos, cap. 2, apêndice, p. 32/4. 

l O tradicional Pedra, Papel ou Tesoura (originário do Japão) é um típico jogo simultâneo de soma zero. Quem 
escolhe a estratégia “pedra” (mão fechada) quebra “tesoura” (dedos indicador e médio abertos), empata com “pedra” e perde de 
“papel” (mão aberta). “Papel” cobre a “pedra”, empata com “papel” e perde de “tesoura”. Esta, por fim, corta “papel”, empata 
com “tesoura” e perde de “pedra”. 





adiante, uma estratégia dominante, ponto de sela, ou equilíbrio entre as opções dos 


Jogadores nessa circunstância. Já o xadrez, tal como o jogo da velha, é estritamente 
determinado. 


Os jogos de soma zero tiveram sua análise esgotada em Theory of Games and 
Economic Behavior, de John von Neumann e Oskar Morgenstern. E durante o curto 
período que antecedeu a tese de John Nash, mesmo os jogos de soma diferente de zero 
poderiam ser tratados como de soma zero, bastando para tanto, introduzir um joga- 
dor a mais que assumisse as perdas da totalidade ganha pelos outros jogadores. Como 
propunham Von Neumann e Morgenstern, esse jogador “não teria influência direta 
no curso do jogo”!*. Seu papel, embora fictício, muitas vezes poderia ser associado à 
função exercida pela natureza, ou o tesouro nacional de um país qualquer, nos jogos de 
uma ou mais pessoas em que os recursos naturais ou monetários são partilhados pelos 
Jogadores que tomam a decisão de dividir esses bens entre si. Nesses casos, a natureza 
ou o tesouro assumiriam os prejuízos ou absorveriam os excedentes gerados pela in- 
teração dos demais jogadores. Muitos autores consideram a redução dos modelos de 
jogos à soma zero de pouca utilidade para as ciências sociais, pois, como lembra Silvia 
Nasar, “até mesmo na guerra há, quase sempre, algo a ser obtido da cooperação”. 
Não obstante, reconhecer jogos de soma zero, numa escala mais ampla, ajuda a enten- 
der melhor os problemas ambientais, na perspectiva da tragédia dos comuns apresenta- 
da pelo biólogo Garrett Hardin (1915-2003) no artigo The Tragedy of the Commons (A 
Tragédia dos Comuns), de 1968. 


Hardin imaginou a situação de pecuaristas que mantêm a maior quantidade de 
gado possível em terras devolutas, sem dono, mas de uso comum. Tudo vai bem en- 
quanto o crescimento vegetativo da população fica abaixo da capacidade da terra se 
recuperar. Porém, paradoxalmente, quando as metas de bem-estar social conseguem 
tornar prósperas as vidas das pessoas, o número crescente de gado no pasto, acaba 
levando à ruína os criadores que buscam maximizar seu ganho na venda de carne ou 
leite, já que o custo de manutenção de cada animal não pode mais ser suportado pelos 
recursos “gratuitos”, mas limitados da natureza?. O mesmo acontece com o cresci- 
mento populacional, a poluição, a devastação das florestas e todo tipo de ação que vise 
tirar proveito das externalidades dos bens públicos. 


Todavia, jogos que não são estritamente competitivos permitem aos participan- 
tes preferirem opções que não estão em total oposição entre eles. Um jogador pode 
desejar obter um resultado que o favoreça, sem necessariamente causar prejuízo ao 
outro. O que não é possível em jogos de duas pessoas e soma zero. Ademais, jogos de 
soma variante, diferente de zero, ao serem repetidos várias vezes podem promover a 
cooperação, apesar de nenhuma comunicação prévia ter ocorrido. Através de vias in- 
diretas, como a sinalização, convenções ou encontro de pontos focais, tacitamente, as 
escolhas de estratégias favoráveis entre as partes acontecem assim que uma solução 
única se mostre nítida a todos de modo semelhante. 


Ao contrário dos jogos de soma zero, onde uma solução direta é passível de ser 
encontrada por meio de estratégias minimax, ou maximin - abordadas no próximo 


18 VON NEUMANN, J. & MORGENSTERN, 0. Theory of Games and Economic Behavior, p.506. 
19 Veja NASAR, S. Uma Mente Brilhante, cap. 9, p. 120. 
20 Veja HARDIN, 6. “The Tragedy of the Commons”. 








ponto -, os de soma variável apresentam características de competição e cooperação 
que dificultam bastante a busca de uma solução que seja aplicável a todos os casos. 
Sem embargo, a abordagem ampla de jogos não estritamente competitivos e de soma 
diferente de zero só foi possível depois de John Nash ter descoberto para os jogos não- 
cooperativos uma solução geral que abrangeu também os cooperativos. Enquanto nos 
Jogos cooperativos os acordos obtidos tornavam obrigatória sua execução, nos jogos 
não-cooperativos não fica claro se os contratos possíveis serão cumpridos, em parte ou 
em sua totalidade, como ocorre quando se defrontam seres egoístas, dotados de racio- 
nalidade instrumental, que usam de qualquer meio para satisfazerem seus interesses 
imediatos. A prova da existência de um ponto de equilíbrio, do qual nenhum jogador 
poderia fugir unilateralmente sem afetar o resultado do outro, serviu não só para re- 
solver os problemas formais restritivos da Teoria dos Jogos cooperativos, mas fez com 
que as ciências sociais pudessem aplicar esse tipo de ferramenta de análise fora dos 
domínios da economia e da matemática. 


De qualquer maneira, todos os jogos proporcionam a oportunidade de avaliar 
formalmente a relação das listas de preferências manifestas, de duas ou mais pessoas. 
Contudo, durante o desenrolar das partidas, aspectos psicológicos estão a todo mo- 
mento ameaçando a manutenção da racionalidade estratégica pressuposta pela Teoria 
da Utilidade adotada no modelo de jogos. Utilidade é um dos diversos termos da teoria 
que causam confusão entre os filósofos. A moderna teoria da utilidade traçada por 
Von Neumann e Morgenstern difere em muitos pontos da antiga noção de utilidade 
que subjaz, principalmente, ao Utilitarismo dos seguidores de Jeremy Bentham (1748- 
1832) - sobretudo o caráter moral que obrigaria aos governos maximizar a utilidade 
da maioria da população, sem considerar os ganhos individuais em primeiro lugar”. 


Utilidade 


Tudo que Von Neumann e Morgenstern pretendiam construir com o livro de 
1944 era um mero procedimento matemático que pudesse servir como instrumento de 
análise de situações em que se pode comparar as utilidades das pessoas envolvidas. Em 
outras palavras, o problema da comparação das utilidades era visto como uma tentati- 
va de avaliar o conjunto de possibilidades de atuação de um agente (indivíduo ou gru- 
po). com objetivo de maximizar ou minimizar a sua satisfação ou frustração, segundo 
uma lista de preferências. O que não quer dizer que a maximização da utilidade tenha 
de contemplar apenas interesses mesquinhos ou egoístas, no sentido de exclusivida- 
de. Irmã Dulce (1914-1992) ou a Madre Teresa de Calcutá (1910-1997), ao buscarem 
fornecer o máximo de recursos aos pobres e miseráveis, no Brasil e na Índia, respecti- 
vamente, estavam também, do ponto de vista da teoria dos jogos, maximizando seus 
próprios interesses. Como diria o psicólogo e matemático canadense Anatol Rapoport 
(1911-2007), “não há contradição entre esse impulso de caridade e a maximização da 
utilidade”? Assim, para a Teoria dos Jogos, a utilidade nada mais é do que uma uni- 
dade de medida padrão expressa em util (no plural, utiles) ou em valores monetários. 


Quanto às circunstâncias em que é feita, a seleção da linha de ação que será 


al O que não impediu o psicólogo Daniel Kahneman de tentar uma aproximação entre os dois conceitos no artigo “Ex- 
perienced Utility and Objective Happiness” (2000), incluído na coletânea KAHNEMAN, D. & TVERSKY, A. Choice, 
Values and Frames, bem como Harsanyi de defender a validade do utilitarismo frente a outras teorias morais, com base na 
teoria dos jogos (em HARSANYI, J. “Game and Decision Theoric Models in Ethics”). 

22 RAPOPORT, À. Lutas, Jogos e Debates, part. II, cap. VI, p. 91. 





adotada se faz sob condições de certeza, risco, incerteza ou, como Robert Duncan Luce 


(1925-2012) e Howard Raiffa acrescentaram, à luz de evidências empíricas que mis- 
turam risco e incerteza?. Num cenário de certeza, sabe-se que cada ação conduzirá 
invariavelmente a um resultado específico. Sob risco são tomadas as decisões cujas 
ações levam a um dos possíveis resultados esperados a uma taxa de probabilidade 
conhecida - como os 50% de chances de sair ou cara ou coroa no lançamento de uma 
moeda ao ar. À incerteza diferencia-se do risco pelo fato da probabilidade não ter uma 
proporção fixa predeterminada - as chances de chover amanhã, por exemplo. Para que 
as escolhas sejam plausíveis, um conjunto de axiomas propostos por Von Neumann e 
Morgenstern e sustentado por vários autores postula, em geral, que haja pelo menos: 


a. ordenamento das alternativas; 
b. transitividade das preferências; 
c. continuidade; 


d. combinação e substituição delas por chances de obtenção de um ganho ao qual 
se é indiferente. 


O ordenamento das preferências, ou indiferença, exige que o jogador prefira uma 
oportunidade a outra ou seja indiferente às duas. Assim, para o teórico dos jogos não 
haveria coisa alguma que não fosse passível de comparação com outro objeto, alvo 
de crença ou desejo. Na comparação entre objetos, sorteios compostos, nos quais se 
passa de um sorteio para o outro, podem ser reduzidos a uma simples loteria em que a 
probabilidade final de alcançar um resultado incorpora as chances de cada ramo que 
traça o caminho que leva até o nó terminal, na forma extensiva. À transitividade das 
preferências e indiferenças das coisas e loterias é uma relação que evita a circularidade 
e inconsistência que tornariam praticamente intratável a teoria da utilidade. Pois, se 
alguém prefere “A” a “B” (A > B) e “B” a “C” (B > C€), conclui-se que também prefira 
“AM a “C” (A > C), ou seja indiferente caso haja indiferença entre “A” e “B” (A = B) e 
“B” e“C” (B=C). Se a probabilidade de ganhar algo desejado for indiferente à posse 
de um outro objeto de ganho certo, o jogador deverá arriscar-se ao sorteio sempre que 
existir um número racional entre 0 e 1 ao qual se esteja indiferente entre uma loteria 
que envolva o objeto mais querido e a posse de outra coisa inferior. O que, em resumo, 
equivale à existência de uma continuidade na lista de preferências de um agente e um 
ponto em que se possam estabelecer comparações entre elas: “tudo tem seu preço”. Por 
conseguinte, exige-se que um sorteio possa ter um de seus prêmios substituídos por ou- 
tro, permanecendo as demais alternativas inalteradas, sem que se mudem as preferên- 
cias do jogador entre o prêmio original e o substituto, de modo que a primeira loteria 
e a nova sejam indiferentes. Ou seja, um jogador que se mostrar indiferente entre um 
prêmio novo e o anterior, também deverá sê-lo quanto às duas loterias propostas nas 
mesmas condições. Assim, se uma substituição provocar uma melhoria na premiação, 
a loteria modificada deverá ser melhor que a original. Tal pressuposto é conhecido ain- 
da como a hipótese de independência das alternativas relevantes, ponto crucial na dis- 
cussão que o economista francês Maurice Allais estabeleceu em 1953. Afinal, havendo 
a possibilidade de mais de um sorteio ocorrer, aquele cuja probabilidade de obtenção 
de algo que seja melhor for maior deverá ser o escolhido, de acordo com uma última 


23 De acordo com LUCE, R. D. & RAIFFA, H. Games and Decisions, à 2.9, p. 31. 








condição chamada monotonicidade. 


A função de utilidade, portanto, faz a associação de números às preferências 
e às circunstâncias em que a sorte leva a resultados finais almejados. Ela permite a 
comparação das utilidades de diferentes pessoas como medidas intervalares de escalas 
diferentes ou mesmo desconhecidas. Como explica Rapoport, o ponto zero e a unida- 
de das escalas podem ser arbitrários, bastando apenas a determinação da proporção 
de cada par de diferenças da utilidade, do mesmo modo que se comparam as escalas 
de temperatura, seja em graus Celsius, Fahrenheit ou Kelvin”. Entretanto, a preten- 
são de quantificar qualquer objeto que seja alvo do interesse de um agente, incluindo 
sentimentos subjetivos, abriu espaço para diversas especulações, apoiadas em expe- 
rimentos laboratoriais e de campo. Allais argumentou que indivíduos, em geral, não 
consideram as probabilidades objetivas em suas decisões, mas adotam probabilidades 
subjetivas, representações psicológicas, quando defrontados a situações de risco. Na 
prática, isso poria abaixo os axiomas de independência forte ou substituição. 


Entre escolhas de ganhos certos e indeterminados como neste exemplo em que 


A. certeza de receber 100 milhões ou a 


B. probabilidade de 10% de ganhar 500 milhões e 89% de ganhar 100 milhões e 
1% de nada obter; 


a maioria das pessoas prefere a opção “A” mais do que “B” (A > B). Contudo, quando 
o quadro muda e são oferecidas as chances de... 


C. ganhar 100 milhões a 11% e 89% de nada ganhar ou 
D. 10% de ganhar 500 milhões e 90% de obter zero 


agora a maior parte responde preferir “C” a “D” (C > D), embora o valor de 
cada alternativa seja respectivamente: 100 milhões para “A”; 139 milhões a “B”; 11 
milhões a “C” e 50 milhões a “D”. O que significa que a relação de preferências entre 
esses resultados não preserva os mesmos valores em circunstâncias objetivamente 
semelhantes, pois o desejo pelo ganho certo que a maioria das pessoas manifesta, 
quando indica “A > B”, não se repete na variação presente em “C€ > D”, cuja diferença 
de 39 milhões é igual nas duas loterias?. 


Este exemplo fornecido por Allais apontou para uma forte deformação provo- 
cada pelos valores psicológicos sobre a expectativa de resultados, cuja pretensão de 
satisfação absoluta da utilidade, através de escolhas aleatórias, se mostrou inviável, 
devido aos desvios empreendidos às estratégias preferidas na presença de fatores de 
risco. Os componentes psicológicos, que tanto influenciam as decisões corretas, tive- 
ram então de serem melhor avaliados pelos psicólogos e teóricos dos jogos que, embora 
reconhecessem as dificuldades de formalização do processo amplo de deliberação que 
envolve os sentimentos emersos de cenários incertos, percebiam que suas principais 
falhas recaíam sobre a descrição da condição natural do agente e não sobre o método 
de axiomatização, propriamente dito, empregado pela teoria. As tentativas de Har- 


24 Veja RAPOPORT, A. Op. cit. part. II, cap. VI, pp. 98 e ss. para conhecer essa passagem e os detalhes do exemplo 
esclarecedor da temperatura. 
25 Veja ALLAIS, M. F. Ch. “Le Comportement de 1 Homme Rationnel Devant le Risque”, p. 521. 





sanyiou Kahneman e Tversky, para citar apenas os laureados com Nobel, ajudaram a 


traçar com maior precisão a maneira adequada de se chegar a uma solução com o uso 
do cálculo das probabilidades e com a percepção dos efeitos da aversão e busca do risco 
nos casos de ganhos e perdas, respectivamente. 


$2. Estratégias Dominantes, Maximin, Mistas e Noção de Equilíbrio 


Após estabelecer a lista ordenada de suas preferências e relacioná-las a uma fun- 
ção de utilidade, os agentes devem estar aptos agora para preencherem as matrizes e 
os esquemas de árvores, segundo as linhas de ação disponíveis. Os valores que cada 
parte receberá com o encontro dessas estratégias dependerão das escolhas que fizer 
individualmente. Por princípio, supõe-se que todos busquem maximizar seus resulta- 
dos e, ainda que não consigam, se empenhem para que isto ocorra. À Teoria dos Jogos 
tem instrumental suficiente para analisar jogos de azar - dados e roleta, por exemplo -, 
mas vai além da simples teoria dos jogos de azar que tem sua sustentação na teoria da 
probabilidade. Nos jogos de azar, a natureza é o único jogador com o qual se tem que 
defrontar, bastando apenas apurar a utilidade esperada com base no cálculo das chan- 
ces de um resultado acontecer. Porém, nos jogos de estratégias - desde o jogo da velha ao 
xadrez, passando pelos jogos de cartas como pôquer, bridge ou sueca - presume-se que 
haja mais de um jogador racional, cujas deliberações levam em conta, recursivamente, 
aquilo que o adversário fará em consequência de seu raciocínio pressuposto. Ademais 
Jogos de estratégias que envolvem habilidade dos jogadores - como o duelo e os esportes 
olímpicos, em geral - também são passíveis de estudos semelhantes aos feitos por Mar- 
tin Shubik em Teoria dos Jogos nas Ciências Sociais, de 1982, onde se avalia o momento 
exato de se realizar as melhores estratégias disponíveis, com as chances adequadas de 
se acertar o alvo. 


Para não sobrecarregar demais esta introdução à Teoria dos Jogos e da Coopera- 
ção, nos concentramos nos jogos de estratégia entre dois jogadores que disponham de 
duas estratégias (2 x 2) que, embora façam forçosas simplificações, servem de modelo 
explicativo para um vasto espectro de situações cotidianas em que os interesses dos 
Jogadores podem coincidir ou divergir em parte. Na perspectiva dos jogos, estratégias 
são programas que instruem qual linha de ação um jogador adotará durante toda par- 
tida, antes mesmo dela começar, dependendo do que o adversário fará. Em termos de 
Jogos extensivos, uma estratégia descreve o caminho que um jogador percorrerá desde 
o seu primeiro lance até o nó terminal. Quando o jogo ou a interação entre mais de um 
agente interessado em satisfazer ao máximo sua utilidade acontece em mais de uma 
etapa de decisão, as estratégias devem traçar um plano de escolhas para cada ponto 
de decisão, formando uma sequência completa de movimentos, através dos conjuntos 
de informações disponíveis, tendo em vista os melhores valores oferecidos no final. Há 
uma forte interdependência das decisões que os adversários tomarão em suas expecta- 
tivas recíprocas do comportamento do outro. O processo de deliberação que visa ma- 
ximizar os ganhos finais tem, portanto, de compreender adequadamente a capacidade 
do oponente reagir a suas ações, conforme a conduta esperada entre seres semelhantes, 
nem sempre racionais de todo. 


Cada jogador dispõe de um conjunto de estratégias puras que podem ser 
misturadas entre si e combinadas com as dos outros agentes. De acordo com a 


combinação específica para as estratégias de diferentes jogadores, os resulta- 








dos finais para cada indivíduo corresponderão um ganho próprio que relacio- 
nado ou não com a solução do jogo. Na matriz simples, desenhada na figura 1.4... 


Figura 1.4 
Coluna 


Estratégias Esquerda Direita 





«não é difícil para as partes coordenarem suas ações em direção ao resultado do alto, 


à esquerda. Pois ambos possuem estratégias dominantes que se encontram naquela 
célula da matriz 2 x 2. Para Linha, Alto é a estratégia que domina Baixo, qualquer que 
seja a escolha que a Coluna faça. Isto é, garante-lhe o melhor ganho (1) caso Coluna 
jogue Esquerda ou Direita, frente aos ganhos de Baixo (0). Por sua vez, Coluna tem 
em Esquerda a sua dominante, já que é a única a lhe fornecer um a mais do que o zero 
da Direita, a despeito do que Linha jogue. Assim, (1, 1) será o par de recompensas que 
soluciona facilmente interações desse tipo entre agentes racionais, sem muitos sustos, 
graças à dominância de suas estratégias mútuas. Os interesses de ambos convergem 
para o alto, à esquerda. 


Até aqui, nenhum problema em relação aos aspectos psicológicos da outra parte 
poder afetar os ganhos esperados de um jogador racional. Coisa diferente enfrentam 
as pessoas quando uma pequena mudança nos ganhos da matriz passa a comprometer 
uma eficiente coordenação das ações. À figura 1.5 apresenta dois resultados conjuntos 
que favorecem ambos jogadores. Agora não há uma estratégia dominante a orientar 
as escolhas dos dois. No entanto, é preciso que os atores cheguem a um acordo sobre 
quais de suas estratégias conjuntas, (alto, esquerda) ou (baixo, direita), ambos ado- 
tarão a fim de maximizar suas utilidades esperadas. Na ausência de qualquer meio de 
comunicação ou de uma dica que indique uma regra de coordenação, os jogadores pre- 
cisam buscar um ponto focal que sirva como sinal para o encontro no lugar adequado. 
Esse sinal deve estar oculto de tal modo que permita sua localização de forma rápida, 
mas não tão fácil como no jogo da figura 1.4. A solução desse enigma só é possível se 
estiver ao alcance da capacidade racional dos agentes. Alguma experiência comum 
prévia deverá ter sido partilhada antes pelos jogadores, para facilitar o estabelecimen- 
to de uma convenção que, na ausência de uma outra “cola”, será adotada tacitamente 
pelos participantes de uma mesma cultura. Por exemplo, membros da cultura ociden- 
tal, que desde a infância são acostumados a iniciar a escrita da esquerda para a direita 
e de cima para baixo, poderiam concordar em selecionar as estratégias “alto e esquer- 
da”. Contudo essa dica poderia ser confusa caso “baixo, direita” viesse grafada com 
letras maiúsculas ou um mediador confiável sugerisse sua escolha. Segundo Thomas 
C. Schelling, para situações como essas a Teoria dos Jogos deveria incorporar habili- 
dades ao agente que vão além da mera racionalidade estratégica, tais como restrições 
estéticas, casuísticas e geométricas que eliminassem as ambiguidades que perturbam 
os acordos tácitos”. 


26 Veja SCHELLING, Th. C. The Strategy of Conflict, ap. C, p. 295. 
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Tanto “alto-esquerda”, como “baixo-direita”, não constitui a rigor uma solução 
para jogos do tipo da figura 1.5. De fato, no sentido que Luce e Raiffa deram à solução 


no estrito senso, para ocorrer em jogos não-cooperativos seria preciso: 


1. existir um par em equilíbrio entre os conjuntos de pares de estratégias admis- 
síveis; e 
2. que todos os pares em equilíbrio admissíveis fossem ambos intercambiáveis e 


equivalentes”. 


Desde John Nash, um ponto de equilíbrio é todo aquele que seja o encontro das 
estratégias ótimas de cada jogador com as dos adversários?. Por exemplo, “alto-es- 
querda” está em equilíbrio nas Figuras 1.4 e 1.5, enquanto “baixo-direita” apenas 
na segunda matriz. Entretanto, na Figura 1.4, só “alto-esquerda” é uma solução no 
estrito senso, embora não seja na Figura 1.5, que inclui “baixo-direita”. Pois, neste 
caso, não se pode trocar as estratégias da linha pelas da coluna de modo a formar ou- 
tros pares equivalentes, ou seja: “alto-esquerda” (1, 1) e “baixo-direita” (1, 1) não são 
intercambiáveis, porque “alto-direita” (0, 0) ou “baixo-esquerda” (0, 0) não formam 


os mesmos resultados em equilíbrio. 


Para solução de jogos onde os interesses dos participantes coincidem, a comuni- 
cação pode vir a resolver satisfatoriamente, promovendo a cooperação e coordenando 
as ações. Contudo, em jogos tácitos, quando ela não é possível explicitamente, as di- 
ficuldades técnicas podem ser superadas por normas culturais, convenções ou pontos 
focais partilhados e pela simetria que assegura um comportamento semelhante aos 
agentes em jogos cooperativos. Assim que a estratégia comum é percebida, não há por- 
que desviar do consenso, sem perdas mútuas. Se nenhum acordo implícito é previsto, 
só se pode esperar que o resultado alcançado seja a média dos pares em equilíbrio, no 


caso da figura 1.5, meio para ambos jogadores. 


Ao transformar a matriz da figura 1.5 em jogo de soma zero, como na figura 


1.6. Desaparece o interesse por uma solução que vise coordenar as escolhas conjuntas, 
uma vez que cada um procura jogar sua estratégia dominante alto e direita, respecti- 


21 LUCE, R. D. & RAIFFA, H. Games and Decisions, 8 5.9, p. 107. 
28 NASH, ]. “Non-Cooperative Games”, p. 281. 
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vamente, para a Linha e Coluna. O encontro dessas duas estratégias resulta em zero 
para ambos jogadores, em “alto à direita”. Um ponto de equilíbrio que corresponde ao 
chamado ponto de sela nos jogos de soma zero. Este representa, para Linha, o máximo 
dos ganhos mínimos em suas linhas e o mínimo dos máximos de suas colunas. De modo 
inverso, para Coluna, é o mínimo dos máximos em suas linhas e o máximo dos mínimos 
de suas colunas. Em outras palavras, do ponto de vista da Linha, é o ganho menor em 
uma linha que seja o maior na mesma coluna (maximin); ou, da perspectiva da Colu- 
na, o maior ganho de uma linha que também é o menor da coluna. Trata-se de uma 
posição em que cada um dos jogadores procura fazer o melhor para si tendo em vista a 
oposição do outro, diminuindo ao mínimo suas perdas esperadas. Aqui, a comunicação 
em nada ajuda a melhorar o resultado final do jogo, pois os interesses são totalmente 
opostos: para Linha escolher “alto” é a única solução admissível, já que se optasse por 
“baixo”, Coluna, ao selecionar “direita”, lhe proporcionaria o pior resultado (-1), ao 
passo que permanecendo no “alto”, o mínimo que ganharia seria zero. Por outro lado, 
Coluna também sabe que, se escolhesse “esquerda”, poderia perder -1, enquanto “di- 
reita” lhe garante ao menos zero”. 


No jogo de soma zero, o encontro de duas estratégias dominantes correspondem 
a um ponto de sela. Entretanto, quando não há uma dominância entre as estratégias, 
pode haver mais de um ponto de sela ou mesmo nenhum. A existência de pontos de 
sela significa que há possibilidade de uma solução minimax, ou maximin, como fora 
previsto por Von Neumann e Morgenstern””. Sempre que houver mais de um ponto de 
sela, todos os resultados serão iguais. No caso desses resultados serem intercambiáveis, 
o jogo terá então uma solução no estrito senso, como nos jogos de soma variável. 


Estratégias Mistas 


Embora a solução maximin pareça razoável para jogos de soma constante, quan- 
do não há ponto de sela ou a soma é diferente de zero, será necessário fazer uma mis- 
tura que diminua os riscos de perdas ou promova outro ponto de equilíbrio que não se 
alcança apenas com o recurso de estratégias puras ou estritas - aquelas que são listadas 
nas matrizes básicas. Quando os interesses não são totalmente opostos ou coinciden- 


29 Os detalhes técnicos dos pontos de sela podem ser apreciados diretamente em VON NEUMANN, J. & MORGENSTERN, 0. 
Theory of Games and Economic Behavior, 39 134.1 a 3, pp. 93-5. Para uma explicação informal, veja RAPOPORT, À. 
Lutas, Jogos e Debates, part. II, cap. VII, pp. 104 a 109. 

30 Veja VON NEUMANN, J. & MORGENSTERN, 0. Op. cit., 8 17.6, pp. 1539-155. 








tes, é possível achar estratégias mistas que ofereçam um melhor saldo para ambos jo- 
gadores, em equilíbrio de Nash. Na próxima matriz, figura 1.7, as circunstâncias não 
são plenamente competitivas ou de mera coordenação das ações. Os agentes devem 
buscar um consenso sobre qual dos resultados mostrados eles se encontrarão, a fim de 
evitar os piores resultados. 


Figura 1.7 
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À primeira vista, uma rodada de comunicação prévia poderia solucionar o pro- 


blema, não fosse a tentação de um deles ameaçar jogar sua estratégia favorita, cor- 
tando, em seguida, a ligação entre os dois. Linha, por exemplo, caso falasse primeiro, 
afirmaria a disposição de jogar “alto”, e ponto final! Sem deixar à Coluna outra opção 
além de seguir pela “esquerda”, pois ganhar um seria melhor do que nada. Imaginar o 
inverso disso faria com que Coluna dissesse “direita”, obrigando Linha jogar “baixo”. 
Tem-se, então, a situação interpretada por Luce e Raiffa como uma “Batalha dos Se- 
xos”, onde um casal teria de decidir qual programa para a noite: ir ao balé ou assistir 
uma luta de boxe”! A senhorita Linha prefere ir ao Balé com o senhor Coluna, em 
primeiro lugar. Sua segunda preferência é ir ao Boxe com ele. Ao contrário, o senhor 
Coluna prefere esta última possibilidade antes de tudo, sendo seu “plano B” ir ao Balé 
com ela. 


Na Batalha dos Sexos, nenhuma estratégia pura garante uma solução para o 
Jogo. Ainda que alguém ameace seguir sua estratégia favorita, não raro a retaliação do 
outro ocorre na escolha de sua própria estratégia preferida, com intuito de preservar 
a reputação de pessoa firme que não se curva a ameaças. Só o recurso a uma mistura 
de suas estratégias estritas permite encontrar um resultado que pareça satisfatório 
para ambos os jogadores. O teorema minimax, ou maximin, ofereceu como solução 
para essas circunstâncias a aplicação das estratégias disponíveis segundo uma taxa de 
frequência determinada?. A fim de obter-se a melhor mistura, que garanta, ao menos, 
o mais alto ganho entre os piores, o método simples para jogos 2 x 2, descrito por Ra- 
poport? 
e Baixo, para o jogador da linha, fazendo depois a razão da segunda diferença em rela- 


consiste em encontrar a diferença entre as notações das duas estratégias Alto 


ção à primeira. Na figura 1.7, para descobrir sua mistura minimax, a Linha deve sub- 
trair zero de um na estratégia “Alto” e zero de dois na estratégia “Baixo”, cuja razão 
em relação à primeira produz 2:1, o que leva a uma proporção de (2/3 Alto, 1/3 Baixo). 
Rj] Em LUCE, R. D. & RAIFFA, H. Op. cit. 3 5.3, pp. 90 e ss. 

2 Veja RAPOPORT, A. Lutas, Jogos e Debates, cap. IX, pp. 122 e ss. 


38 Em RAPOPORT, À. Op. cit., cap. IX, p. 123. SIMONSEN, M. H. Teoria dos Jogos, 1.1, pp. Il e ss. oferece a técnica 
formal para encontrar-se os valores de uma estratégia mista em jogos bi-matriciais. 








Por sua vez, Coluna diminui zero de dois e zero de um, à esquerda e à direita, gerando 
1:2 e, em consequência, (1/3 Esquerda, 2/3 Direita). Agora, ambos jogadores podem 
calcular o valor esperado para a situação em que se encontram. Linha multiplica a 
proporção de Alto com a probabilidade da Coluna fornecer-lhe dois ou zero, somando a 
proporção de Baixo e multiplicando as chances de obter zero ou um, do seguinte modo: 


v(1) = 2/3(1/3 x 2) + 2/3(2/3 x 0) + 1/3(1/3 x 0) + 1/3(2/3 x 1) = 
=2/3x9/3+1/3x2/3= 
=4/9+2/9=6/9=2/3 


É conclui que seu valor será de 0.66 util. Menos do que um util certo que ga- 
nharia em Baixo-Direita. Fazendo as contas de seu valor, Coluna chega à conclusão 
semelhante, simetricamente: 


v(c) = 1/3(2/3 x 1) + 1/3(1/3 x 0) + 2/3(2/3 x 0) + 2/3(1/3 x 2) = 
=1/3x2/3+2/3x2/3= 
=2/9+4/9=6/9=2/3 


Por causa da simetria do jogo, as misturas de estratégias minimax garantem aos 
dois jogadores os mesmos resultados conjuntos (0.66, 0.66), nesta versão da Batalha 
dos Sexos”. O sucesso que a minimax oferece em jogos de soma zero, ao reduzir ao mí- 
nimo as perdas de cada parte, nem sempre é garantia de boa escolha em jogos de soma 
variante. A Batalha dos Sexos não é um jogo de soma constante e soluções melhores 
podem ser encontradas, como se verá quando os jogos falados forem analisados na se- 
gunda unidade deste curso. Quando se trata de ganhar ou perder, a mistura minimax 
pode vir a ser o único conselho a sugerir, como na figura 1.8, montada por Rapoport. 
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Semelhante à Batalha dos Sexos, aqui não há um ponto de sela que represen- 
te a maximin das estratégias puras. À estratégia mista maximin da Linha chega ao 


34 K rigor a versão original deste jogo, criado por Luce e Raiffa, proporciona os resultados negativos (-], -1) para as 
estratégias Alto-Direita e Baixo-Esquerda; enquanto David Marc Kreps constrói sua matriz de um modo mais realista assim: 
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Para explorar as consequências destas mudanças, veja 29 e KREPS, D. M. Games Theory and Economic Modelling, 
cap. 4, Pp. 99 e ss. 
35 Veja RAPOPORT, A. Idem, cap. IX, pp. 125 e ss. 





valor de 5/7 util com a proporção (4/7 Alto, 3/7 Baixo), da mesma forma que mistura 
maximin da Coluna (5/7 Esquerda, 2/7 Direita). Com isso, Rapoport conclui que seria 
prejudicial aos jogadores fugir da aplicação das estratégias mistas, pois, a longo pra- 
zo, essa seria a melhor probabilidade para as partes envolvidas nessas circunstâncias 
e outra opção seria desvantajosa. Inferência que Morton D. Davis contestou em sua 
introdução não-técnica intitulada Teoria dos Jogos, de 1970. Por ser um jogo de soma 
zero, não haveria porque se acreditar que o uso da mistura maximin seria desvantajosa 
ou vantajosa para ambos oponentes, pois um terá necessariamente de ganhar ou perder 
ao realizar suas ações, o que inviabilizaria por contradição a bem-sucedida aplicação 
da estratégia mista pelas partes, ao mesmo tempo. Optar por esta linha de ação seria 
atraente, graças à suposta segurança oferecida de obter aquele resultado. Porém, para 
Davis isso não passa de “uma questão de gosto pessoal” pela segurança”, uma vez 
que, ao buscarem outras estratégias, jogadores audazes, amantes do risco tornariam 
imprevisível qualquer resultado factual. Apenas um vencerá com certeza. Só não se 
sabe quem! 


Em razão do teorema minimax, o jogo geral de duas-pessoas, 
soma-zero, tem boa base teórica. Mas, sendo jogo de informa- 
ção perfeita, raramente surge na prática. A dificuldade está no 
requisito de o jogo ser soma-zero. 


A presunção essencial sobre que se assenta a teoria é a oposição 
de interesses de dois jogadores. Na medida em que a presun- 
ção não seja válida, a teoria será irrelevante e desorientadora. 
Frequentemente, a presunção parece estar satisfeita, mas, em 
realidade não o está. (...) (DAVIS, M. D. Teoria dos Jogos, cap. 
3, p. 97). 


Em jogos cuja soma dos resultados é diferente de zero, a estratégia mista maxi- 
min” não é a única solução existente, nem mesmo a melhor. Na Batalha dos Sexos, 
apesar da comunicação gerar oportunidades de ameaças, em uma rodada prévia iso- 
lada, quando se busca a coordenação, a troca indeterminada de mensagens poderia 
fornecer melhores resultados que a estratégia maximin mista. Isso ampliaria o espaço 
de resultados originais até a fronteira de eficiência conhecida como ótimo de Pareto, na 
qual nenhum agente obterá melhor resultado sem diminuir os ganhos da outra parte. 
Como sugeriram Luce e Raiffa, na possibilidade de comunicação, as partes poderiam 
concordar em aceitar um mecanismo equânime que permitisse a mesma escolha das 
estratégias “Alto-Esquerda” ou “Baixo-Direita” na mesma proporção meio a meio. 
Com isso, cada um obteria 3/2 - somando os ganhos (2, 1) e (1, 2), dividindo-os, depois, 
por dois, achando (3/2, 3/2) -, bem acima dos 2/3 anteriores*. 


36 DAVIS, M. Teoria dos Jogos, cap. 3, p. 56. 

91 Em tempo, nos jogos de soma zero as estratégias maximin e minimax são equivalentes, entretanto, nos de soma variante 
podem haver diferenças. Em todo caso, a mistura maximin sempre corresponde à proporção encontrada para as estratégias da 
Linha ou da Coluna tendo em vista a diferença de seus respectivos resultados, enquanto a minimax é calculada em função 
dos ganhos recíprocos dos oponentes. Veja, por exemplo, LUCE, R. D. & RAIFFA, H. Idem, à 6.11, pp. 145 a 150. 

38 Nesse caso, as estratégias correlacionadas permitem o encontro de um equilíbrio correlacionado no qual cada 
jogador aceita empregar um mecanismo distribuidor de probabilidades entre os equilíbrios de Nash observados, ampliando a 
utilidade dos jogadores, dentro do conjunto de resultados possíveis. Veja AUMANN, RJ. “Correlated Equilibrium as an 
Expression of Bayesian Rationality”, pp. 1-1. 








Equilíbrio de Nash 


O emprego de estratégias mistas é recomendável sempre que as estratégias pu- 
ras não indicarem uma estratégia dominante, uma solução em ponto de sela, ou um 
ponto de equilíbrio. A noção de ponto de equilíbrio, em termos da Teoria dos Jogos, foi 
formalizada por John Nash como uma generalização da solução maximin para jogos 
não-cooperativos de várias pessoas e soma variável, não se restringindo somente aos 
cooperativos de duas pessoas e soma zero. O ponto de equilíbrio, nas palavras de Nash, 
é o conjunto de resultados opostos que maximiza os ganhos de cada jogador em face 
da melhor estratégia do outro”. Nash mostrou que embora pudesse haver jogos em que 
as estratégias puras não apontassem para ponto de equilíbrio, o recurso à mistura de 
estratégia sempre produziria um novo ponto de equilíbrio em jogos finitos. 
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Um equilíbrio de Nash, ou ponto de equilíbrio, portanto, é uma combinação de 


estratégias da qual nenhum jogador pode aumentar seus ganhos unilateralmente, ao 
mudar de estratégia. Para localizar um ponto de equilíbrio em uma matriz, existem 
alguns métodos práticos e simples. O jogador deve descobrir a célula na qual o ganho 
seja, simultaneamente, o máximo da Linha nas devidas colunas e o da Coluna nas suas 
linhas. Visualmente, isto pode ser feito com o recurso de setas ou de letras que mar- 
quem os máximos da Linha (1) e da Coluna (c), sendo equilíbrios de Nash as células que 
contenham as marcas de ambos jogadores ou sejam a convergência das setas. Na ma- 
triz da Batalha dos Sexos (figura 1.9), descrita há pouco, os equilíbrios surgem assim: o 
encontro das estratégias (alto, esquerda) e (baixo, direita) indicam a existência de dois 
pontos de equilíbrio que impedem a escolha de uma única solução usando só as estra- 
tégias puras, motivo pelo qual a mistura de estratégias se faz necessária. Quando um 
Jogo apresenta apenas um ponto de equilíbrio pela combinação de estratégias puras 
é sinal que houve o cruzamento de duas estratégias dominantes. Ou seja, estratégias 
que dominam as outras estratégias de cada jogador, fornecendo o melhor ganho, in- 
dependente do que o outro faça. Assim, no modelo desenhado na figura 1.10, também 
conhecido como “Dilema dos Prisioneiros”, as estratégias “baixo” e “direita” superam 
as respectivas estratégias “alto” e “esquerda”, da Linha e da Coluna. Contudo, a do- 
minância e a perfeição deste ponto de equilíbrio espanta a todos que se defrontam com 
este quadro pela primeira vez. 


A solução que dois agentes instrumentalmente racionais acabam por encontrar 
nunca é a melhor para ambos, no contexto do Dilema dos Prisioneiros, pois o ponto 
de equilíbrio (1, 1) é sub-ótimo em relação a (2, 2), que poderiam obter se adotassem 


39 Veja nota 27. 
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a estratégia dominada. Porém, um agente racional, quando possui uma estratégia do- 
minante, nunca escolhe outra que não esta. Note que a combinação de estratégias 
dominantes conduz sempre a resultados que são equilíbrios de Nash, mas nem todo 
ponto de equilíbrio é formado por pares dominantes, como mostrou a Batalha dos 
Sexos, onde há dois equilíbrios de Nash em estratégias puras que não são dominantes. 


Todas essas técnicas de solucionar um jogo, cooperativo ou não, estão apoiadas 
numa concepção de racionalidade que, apesar da aparente precisão, geram resultados 
paradoxais do ponto de vista filosófico, como no caso do Dilema dos Prisioneiros e 
nestes dois outros apresentados por Mário Henrique Simonsen (1935-1997) em sua 
inacabada introdução à Teoria dos Jogos. Para atacar a fragilidade da suposição de 


racionalidade entre os participantes, Simonsen montou a matriz da figura 1.11'º. 


Figura 1.11 
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Alto-esquerda constitui o único equilíbrio de Nash desta matriz, sendo esquerda 
a estratégia dominante de Coluna. Tendo em mente, o pressuposto de racionalidade 
da teoria, Linha não tem porque se preocupar em escolher a estratégia Alto, uma vez 
que a dominante de Coluna lhe garante três de ganho. Entretanto, Esquerda domina 
fracamente a direita, pois se Linha escolher Alto, Coluna nada perderia mudando de 
dominância para a direita, amargando seu adversário -3 de perda. Sem saber as reais 
intenções de Coluna, Linha pode refletir que o melhor seria reduzir ao mínimo suas 
perdas seguindo a sua maximin localizada em Baixo. Assim, Linha obteria um, pelo 
menos, e Coluna o seu pior resultado, caso viesse a jogar Direita. Simonsen, então, 
advertiu que poderia “ser extremamente imprudente escolher estratégias conducen- 
tes a um tal equilíbrio [de Nash] sem a garantia de que os demais jogadores façam o 


mesmo” 4, 


40 Para os próximos exemplos veja SIMONSEN, M.H. Teoria dos Jogos, 8 1.5, pp. 25-26. 
41 SIMONSEN, M.H. Op.cit., p. 25. 
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Além do mais, os equilíbrios de Nash podem estar em combinações totalmente 


opostas como neste segundo exemplo fornecido por Simonsen e que foi adaptado à 
figura 1.12. De novo, um problema de coordenação surge entre os participantes, mas 
agora ambos preferem ganhar 2, fazendo com que o outro assumisse o prejuízo de -2. 
Contudo, se jogarem suas estratégias favoritas acabariam pior do que no Dilema dos 
Prisioneiros, obtendo o resultado mais baixo possível (-3, -3). Para fugir deste destino, 
a única solução seria adotar mais uma vez suas respectivas estratégias maximin, que 
evita o pior e neste caso garante (1, 1) para as partes. O apoio na racionalidade forte 
exige a aceitação de respostas que transformam o agente estratégico em um homo ceco- 
nomicus caricatural, pois pessoas que não fossem tão “racionais” poderiam alcançar 
um patamar mais vantajoso do que as que agem de modo estritamente racional e ego- 
ísta, como o defendido pela teoria. Isto revela uma certa ambiguidade na concepção 
de racionalidade defendida pelo equilíbrio de Nash, que nem sempre corresponde aos 
melhores resultados possíveis. De fato, testes em laboratórios provaram que a maioria 
das pessoas, formadas ou não em economia ou matemática, procuram soluções que 
sustentem ganhos próximos a uma distribuição justa para todos envolvidos. 
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Na complexidade do contexto social, onde vários agentes racionais atuam no 
sentido de maximizar suas utilidades, satisfazendo seus desejos, não se pode esperar 
tranquilamente que uma “mão invisível” acomode todos interesses através do encon- 
tro das melhores escolhas em equilíbrio. O Dilema dos Prisioneiros, entre outros, re- 
presenta as situações nas quais a disputa entre agentes econômicos redunda em tragé- 
dia como a dos comuns, esboçada por Garrett Hardin. Soluções, como as propostas por 
Nash, são construídas com base em conhecimento a posteriori e não podem servir ide- 
almente a priori para determinar, em todas circunstâncias, as decisões racionais, seja 
lá o que isto signifique. Para evitar o pior, faz-se necessário olhar com maior atenção a 
maneira pela qual as pessoas deliberam em meio a influências emocionais ou culturais. 
Uma observação que valeu o Nobel a Daniel Kahneman. 


$3.4A Irracionalidade do Agente Racional 


As diversas críticas recebidas pela Teoria dos Jogos, em sua forçosa simplificação 
da forma matemática do trato social, concentraram-se principalmente na concepção 
de agente racional adotada e a consequente construção artificial das situações estu- 
dadas. Alguns filósofos apontaram para insuficiência da visão econômica do mercado 


livre, onde as relações de troca sobressairiam a despeito da simpatia, do espírito de 








12, Outros atacaram a restrição da 


equipe e da confiança necessários ao convívio socia 
análise aos contextos competitivos que nem sempre surgem como tal no cotidiano, 
bem como as soluções insatisfatórias sugeridas aos jogadores na condição do Dilema 
dos Prisioneiros e outros modelos abordados". Houve ainda alguns, como Jiirgen Ha- 
bermas, que consideraram a adoção do ponto de vista das relações de troca nas esferas 
públicas - uma das aplicações do modelo de jogos - uma das fontes de patologias sociais 
que desequilibram a interação das sociedades modernas, que deveriam ser apoiadas de 


forma justa na solidariedade, no dinheiro e no poder administrativo”. 


Todas essas objeções filosóficas sucederam às observações feitas, na primeira 
hora, pelo economista francês Maurice E Charles Allais, laureado com o Nobel de Eco- 
nomia de 1988. Allais combatia a excessiva formalização matemática que, na primeira 
metade do século XX, teve seus principais marcos teóricos nas obras dos economistas 
italiano Vilfredo Pareto (1848-1923) e estadunidense Paul Anthony Samuelson (1915- 
2009), prêmio Nobel de 1970. Chamava atenção, sobretudo, para o problema da sub- 
jetividade, deixado de lado pela escola neoclássica em economia, que nos anos 1950, 
predominava nos Estados Unidos. Para Allais, as considerações sobre a cardinalidade 
das preferências individuais, isto é, a observação da intensidade da preferência de um 
sujeito por um determinado objeto, independente do seu ordenamento numa escala 
sequencial de utilidade, da maior para a menor, deveria ter um peso expressivo, a fim 
de explicar com mais naturalidade o comportamento racional diante do risco ou in- 
certeza. 


Aos adeptos do formalismo metodológico que dominou o início da Teoria dos Jo- 
gos, somente a relação ordinal de todas preferências e suas combinações possíveis para 
cada indivíduo tornaria possível a comparação e análise da utilidade entre pessoas de 
gostos e culturas diferentes*. Contudo, os paradoxos apontados pelos experimentos 
de Allais indicaram que tal ordenamento não era suficiente para explicar a atitude 
dos agentes, ditos racionais, frente a opções de sorteio. À avaliação subjetiva das pro- 
babilidades entre duas loterias objetivamente semelhantes revelou a dificuldade de se 
manter a transitividade das preferências, um dos axiomas da teoria da utilidade ado- 
tada pelos teóricos dos jogos. Perdas e ganhos absolutos mostraram suas influências 
nas escolhas em arranjos diferentes que conduziam aos mesmos resultados. Em geral, 
quanto maior fosse o ganho visualizado, maior era a aversão ao risco, e, como de frente 
ao espelho, quanto maior a perda, maior a busca do risco. 


Efeitos dos Defeitos 


Daniel Kahneman, com a colaboração de Amos Tversky, analisou diversos re- 
sultados obtidos em cenários diferentes, onde as pessoas eram submetidas a escolhas 
como nas experiências de Allais, e pôde detectar os efeitos cuja existência reflete a ma- 
neira pela qual os agentes racionais deliberam antes de desempenharem uma linha de 
ação. Os fenômenos observados na reação de estudantes de universidades israelenses 
e dos Estados Unidos chocavam com alguns pilares da teoria da utilidade. Empirica- 
mente, constatou-se que as pessoas superestimavam resultados que são considerados 
42 Veja HOLLIS, M. Trust Within Reason, cap. 8, p. 162 e MACINTYRE, A. (.Dependent Rational Animals, cap. 
9, pp. 114-118. 

43 Veja BLACKBURN, 3. Ruling Passions, cap. 6, pp. 161-198. 


44 Veja HABERMAS, ]. “Concepções de Modernidade”, in Constelação Pós-Nacional, p. 195. 
45 Veja SAMUELSON, P. À. Fundamentos da Análise Econômica, p. 156. 








certos - o chamado efeito de certeza -, em face daqueles que para serem obtidos envol- 
veriam o cálculo das probabilidades. Cerca de 82% de 72 estudantes entrevistados 
escolheram (Loteria [)... 


A. ganhar $2.400 certos, 
enquanto os restantes 18% preferiam a loteria que pagava... 
B. 2.500, com probabilidade de 33%; 
$2.400, com probabilidade de 66% e 
nada com probabilidade de 1%. 
apesar desta oferecer nove utiles acima da opção A. 
Contudo, ao se depararem com outra situação (Loteria II) entre 
A. a chance de 33% de ganhar 82.500 ou 
B. 82.400 com probabilidade de 34%, 


a maioria de 83% optou pelo sorteio “A” que era nove utiles acima da segunda loteria, 
violando o axioma da substituição, como advertira Allais. Pelo axioma da substituição, 
se a probabilidade de ganhar mais em “A” é preferida à de “B”, deveria ser preservada 
a mesma preferência em outro quadro, onde a certeza de um ganho oferecido em “A” 
fosse menor que a chance de obter o mesmo resultado anterior, agora em “B”“º, 


O efeito da certeza foi observado em perspectivas que não preocupavam os agen- 
tes com perdas ou resultados negativos. Os casos que envolviam prospectos negativos, 
por sua vez, apresentavam outro fator virtualmente invertido em comparação ao de 
certeza, chamado efeito de reflexão. Como em um espelho, as respostas oferecidas pelos 
entrevistados refletiam uma ordem inversa das preferências para perdas, em contraste 
com as preferências por ganhos. Assim, entre 95 estudantes, 20% preferiram a loteria 
(Loteria III) cujo prêmio era... 


A. 84.000, com probabilidade de 80%, ao passo que, 
B. 83.000 garantidos 


eram escolhidos pelos outros 80%. Situação completamente diferente da seleção feita 
por 92% desses mesmos 95 que optaram depois pelo sorteio (Loteria IV) com... 


A. perda de $4.000 a 80% de chance, enquanto 8% aceitaram... 
B. perder imediatamente $3.000. 


Os ganhos positivos provocaram nos agentes aversão ao risco, enquanto os qua- 
dros de expectativas negativas estimulavam, ao contrário, a busca ao risco. Nessas 
ocasiões, os mesmos “equívocos” provocados pelo efeito de certeza foram notados em 
ambos os aspectos, positivo e negativo, com a busca pelo ganho seguro, mas de utili- 
dade menor e preferência por resultados negativos incertos, embora de maior perspec- 
tiva, do que a perda absoluta. Por conseguinte, o efeito de reflexão eliminou a aversão 


46 Veja KAHNEMAN, D. & TVERSKY. A. “Prospect Theory”, pp. 265 e 266. Observe que o diagrama de fluxo de decisão 
que constitui a forma extensiva do modelo de árvore na Teoria da Decisão, na qual se inscreve a Teoria das Perspectivas, tem 
como nó de decisão de um jogador o símbolo de um quadrado e nó do acaso, o círculo ou ponto aberto, que representa a raiz 
na árvore de Kuhn. Aqui se usa o padrão geral do modelo de Kuhn, anotando o zero que denota a natureza no respectivo nó de 
onde partam ramos com probabilidades de ocorrência, sem prejuízo compreensão geral. 








pela incerteza nos sorteios negativos, como consequência paradoxal ao efeito de cer- 
teza, passando a incrementar a aversão por perdas e o desejo de ganhos imediatos”. 


A maneira pela qual os cenários eram montados, seja com loterias de resulta- 
dos positivos ou negativos, gerou atribuições de valores diferentes pelos participantes 
aos sorteios. Isso ficou ainda mais evidente quando se detectou o efeito de isolação em 
arranjos feitos com resultados obtidos a partir de probabilidades equivalentes. Para 
facilitar a escolha, com frequência as pessoas deixavam de separar adequadamente 
os componentes semelhantes e distintos, nas situações propostas. Em decisões que 
tinham de ser tomadas em duas etapas sucessivas, como no seguinte exemplo (Loteria 
V - figura 1.13), onde havia a possibilidade de nada ganhar imediatamente e 25% de 
passar ao segundo estágio, no qual teria de escolher entre $4.000, com 80% de chance, 
ou obter 83.000 de uma vez, nas escolhas feitas antes do jogo começar, 78% preferiram 
a última opção - dois porcento a menos do que na Loteria III. Entretanto, quando 
defrontados com outra perspectiva, de ganhar $4.000 com 20% de probabilidade ou 
$3.000 com 25% (Loteria VI - figura 1.14), a primeira alternativa era selecionada por 
65% dos entrevistados, apesar desta ser equivalente a primeira alternativa da situa- 
ção anterior (Loteria V), já que 1/4 de 80% seria a taxa de 20% associada aos 84.000 
daquela. De fato, os participantes interpretaram o jogo de dois estágios, como o da 
Figura 1.13, na perspectiva da formulação padrão da Loteria III e não a da Figura 
1.14, devido o enfoque isolado da decisão tomada no segundo estágio da Loteria Vº*. 


Figura 1.13 Figura 1.14 
0 4000 3000 0 0 4000 3000 0 





As deliberações feitas em mais de uma etapa levam em conta a correspondência 
entre as projeções sem risco e a arriscada, a despeito da mudança objetiva das respec- 
tivas probabilidades ou resultados, tendo em vista todo caminho a ser percorrido. Ou 
seja, a sequência de sorteios em estágio permitiria, na visão dos envolvidos, descartar 
as perdas dos valores oferecidos antes, em uma única perspectiva a partir do seu ponto 
de decisão, como na formulação sequencial da figura 1.13, ao invés de duas situações 
isoladas da figura 1.14, na qual os resultados estavam vinculados a probabilidades de 
ganho, separadamente. Tal modo de compreensão viola a hipótese de que a seleção de 
loterias deveria ser determinada pela probabilidade final dos resultados, recaindo a 


4 Veja KAHNEMAN, D. & TVERSRY. E. Op. cit., pp. 268 e 269. 
48 Veja KAHNEMAN, D. & TVERSKY. A. Idem, pp. 271 e 272. 








escolha sempre pelo maior ganho provável. O isolamento das projeções indicou que a 


certeza contingente de ganhos fixos atrai as pessoas para este resultado, mesmo depois 
de uma sequência de movimentos na qual a sorte interveio, ao contrário do que acon- 
tece em loterias com opções separadas, mas com chances idênticas a de outro quadro 
que tenha sido posto à frente do agente, embora em arranjo diferente. 


Na Teoria das Perspectivas que desenvolveram para explicar a maneira pela qual 
os indivíduos deliberam sob risco, Kahneman e Tversky atribuíram muitas das ano- 
malias detectadas à fase de “edição” das perspectivas, quando muitas operações que 
transformam os resultados e probabilidades são feitas - a saber: ordenação (coding) dos 
ganhos e perdas; combinação das probabilidades de resultados idênticos reduzida a 
uma só probabilidade; separação dos componentes sem risco dos incertos e cancelamen- 
to dos elementos comuns de uma mesma oferta, em loterias com mais de um movimen- 
to. Tudo em função das projeções oferecidas. Neste instante, as ofertas são editadas 
de diversas maneiras, segundo o contexto em que surgem. Assim, pequenas diferenças 
são eliminadas e componentes comuns cancelados por simplificações, provocando as 
inconsistências observadas depois. Ganhos com probabilidades extremamente baixas 
são descartados, amiúde, na fase de edição, enquanto as chances muito altas tornam os 
resultados “certos”. 


Por outro lado, em um fenômeno atribuído a uma função de pesagem (weighting 
function), as pessoas preferem loterias que ofereçam altos valores com baixa probabi- 
lidade de ganhos, ao invés de valores pequenos e certos, como em $5.000 com 0,1% de 
chance, em lugar de $5 garantidos. Embora, aceitem pagar estes mesmos $5 a se arris- 
carem ao prejuízo de $5.000 com 0,1% de probabilidade. Além disso, a diferença entre 
pequenos montantes parece maior do que aquela variação de valores entre quantias 
maiores, como o incremento que é notado facilmente na passagem de 100 para 200, 
mas, na elevação de 1100 para 1200, é quase ignorado”. 


Essas distorções oriundas da fase de edição levam a simplificações que são orien- 
tadas pelo princípio de escolha da perspectiva de valor superior. Ao mostrar isso, a Te- 
oria das Perspectivas passou a ser considerada a tentativa mais precisa de descrever o 
comportamento de agentes racionais em cenários de risco ou incerteza. Pôde-se, então, 
saber o porque das mudanças das preferências pessoais nessas circunstâncias precárias. 
Notou-se também que a experiência prévia de cada um para situações semelhantes in- 
fluenciam fortemente o momento de tomada de decisão. Pequenas mudanças na forma 
de apresentação das alternativas perturbam as escolhas, ainda que os resultados finais 
se mantenham os mesmos. À condição psicológica dos agentes racionais, portanto, 
pôde ser incorporada pela Teoria dos Jogos como um de seus elementos cruciais, agora 
que seus conceitos assumiam caráter formal de trato matemático. A probabilidade 
subjetiva e a cardinalidade das preferências voltavam a merecer uma maior atenção 
por parte dos economistas e matemáticos, no instante de projetar os modelos de jogos 
que se seguiram a essas descobertas. 


A Interpretação Cardinal de Harsanyi 


A falta de consistência das preferências, empiricamente observadas, abalava não 
só o aspecto preditivo do modelo de racionalidade econômica, mas descartava a possi- 


49 Veja KAHNEMAN, D. & TVERSKY. A. Ibidem, pp. 274 e 281. 








bilidade da teoria ser considerada com algum valor normativo. Sobre esse ponto, John 
Harsanyi argumentou que, em algumas condições motivacionais específicas, era possí- 
vel defender a normatividade da utilidade de Von Neumann e Morgenstern. 


Ninguém duvida da validade normativa da aritmética, apesar 
da maioria das crianças não poder resolver problemas aritmé- 
ticos de qualquer complexidade sem treino especial (HAR- 


SANYI, J.C. “Normative Validity and Meaning of von Neu- 
mann-Morgenstern Utilities”, p. 307). 


Assim, o problema principal para sustentação da normatividade das funções de utili- 
dade assentava na necessidade dos agentes racionais passarem a tomar atitudes orien- 
tadas adequadamente pelo resultado, ao invés de aterem-se exclusivamente à utilidade 
do processo. Nesta ótica, as escolhas devem ser feitas com base apenas na avaliação 
da possibilidade dos vários resultados disponíveis. Todo nervosismo do envolvimento 
com uma atmosfera estimulante de aposta, bem como outras experiências psicológicas 
deste tipo, deveria ser deixado fora do processo de deliberação. No entendimento de 
Harsanyi, as atitudes orientadas pelo resultado devem ser guiadas somente por suas 


utilidades resultantes que são assinaladas a cada loteria e por suas respectivas probabi- 
lidades”. 


Deste modo, os axiomas da teoria que garantiriam a monotonicidade (a loteria 
preferida será aquela que for a de maior ou igual probabilidade de fornecer a alter- 
nativa preferida) e a indiferença entre probabilidades equivalentes poderiam preencher 
os requisitos da racionalidade normativa, embora não fossem adequados para pessoas 
orientadas pela utilidade do processo”!. Nos termos de Harsanyi, pessoas orientadas 
pelo processo assumem uma atitude intrínseca de gostar ou não gostar da situação da 
aposta, dependendo da utilidade positiva ou negativa a ela associada, enquanto pesso- 
as orientadas pelo resultado têm uma atitude instrumental em relação às probabilidades 
subjetivas ligadas aos possíveis resultados, segundo o gosto pelos ganhos esperados”. 


Para poder lidar com esses casos, é preciso agora que a função de utilidade seja 
entendida como uma função cardinal e não só ordinal. Isto porque, a cardinalidade 
permitiria a comparação não só do nível de utilidade entre os indivíduos, mas tam- 
bém a utilidade de diferenças entre loterias para o próprio agente, o que facilitaria a 
observação das intensidades ou importâncias atribuídas por cada um a tais sorteios. 
Formalmente, alguém que prefira, por exemplo, A > Be € > D, quando defrontado às 
seguintes loterias: 


L = (A, 1/2; D, 1/2) ou 


1 


L, =(B, 1/2;€, 1/2) 


«preferirá a |, com mais intensidade do que L,, caso prefira 1”, = (A, 1/2;€, 1/2) mais 
do que L”, = (B, 1/2; D, 1/2), indicando a intensidade e importância dada pelo agente 
q 2 p p 8 
à relação A > B, quanto maior for a diferença entre A e B em comparação à existen- 

Ç q Ç Pp Ç 
te entre € > D. Em outras palavras, qualquer loteria que “A” estivesse em jogo seria 
p quala q Jog 
preferível sobre aquelas outras possíveis em que estivesse ausente. Assim, a utilidade 


cardinal aferida poderia conduzir, daqui à utilidade dos resultados de quem adotasse 


50 Veja HERSANYI, ].6. ”Normative Validity and Meaning of von Neumann-Morgenstern Utilities”, pôl2. 
51 Veja HARSANYI, J. C. Op.cit., idem. 
52 Veja HARSANTI, J. C. Idem, p. 314. 








corretamente uma atitude instrumental frente aos riscos, na observação adequada dos 
valores em jogo, enquanto que a atitude intrínseca limitaria o alcance das escolhas das 
pessoas que gostassem ou não de apostas. 


Dessa forma, Harsanyi chamou atenção para o fato de incluir uma interpretação 
cardinal dos pagamentos nas alnálises das escolhas sob incerteza, ao invés de uma 
concentração exclusiva com a relação ordinal dos ganhos. A despeito de economistas e 
matemáticos rigorosos atacarem a cardinalidade - influenciando até mesmo a base te- 
órica empregada pelo filósofo canadense David Gauthier que, em Morals by Agreement, 
se ateve apenas à concepção ordinal dos ganhos e das preferências. A importância de 
observar os ganhos cardinais está na possibilidade de se estabelecer estratégias mistas 
apoiadas em valores contínuos de intensidade que podem variar em grau numa escala 
intervalar de resultados. O que não é viável quando se toma só a ordem de valores e 
a posição dos resultados numa escala de preferências que não leva em conta o peso de 
cada preferência, mas apenas que uma é preferível a outra em uma lista ordenada de 
resultados, não importando qual valor é mais preferido do que outro”. 


Irracionalidade Humana e Racionalidade Fora da Espécie 


Uma postura pela interpretação normativa da racionalidade da teoria da uti- 
lidade, como a proposta por Harsanyi, deixa de lado críticas que poderiam ser feitas 
quanto ao caráter descritivo da teoria, pouco precisa ou inócua para seres vivos, que 
nem sempre agem de modo racional ou sequer possuem um aparato cognitivo desen- 
volvido para a realização desses cálculos todos. Os primeiros ancestrais humanos não 
desenvolveram uma habilidade específica para realização rápida dos cálculos exigidos 
na adoção dos seus efetivos interesses informados, posto que nunca teriam se defronta- 
do com problemas que exigissem um método eficiente de escolha instintiva. Quem de- 
fende o valor normativo do modelo de jogos — tal qual Harsanyi — precisa argumentar 
então que, nas condições atuais da complicada vida em sociedade, o treinamento no 
uso de modelos matemáticos poderia “esclarecer substantivamente muitos problemas 


da ética”, 


Certo é que a formalização matemática implica numa capacidade racional que 
excede a da maioria dos seres humanos, mesmo depois de solucionado o último Teo- 
rema de Fermat. Entretanto, isso não impede que organismos dos mais simples pu- 
dessem ser interpretados como “agentes” dotados de aptidão reativa suficiente para 
poderem seguir as estratégias analisadas pela Teoria dos Jogos. Claro que para os casos 
dos seres não humanos o conceito de racionalidade empregado sofreu profunda trans- 


53 Um exemplo de arbitragem - jogos com três jogadores, sendo o terceiro um mediador que não recebe nenhum ganho - 
adaptado de RAIFFA, H. El Arte y la Ciencia de la Negociación, III parte, cap. XVI, p. 240-242 esclarece como o peso 
que os indivíduos atribuem aos mesmos ganhos pode variar de intensidade entre eles. À negociação da divisão de $100 entre 
ricos e pobres revela o poder de barganha que permite ao mais poderoso arriscar mais do que o fraco na implementação de 
uma estratégia mista. À aversão ao risco conduz uma pessoa carente de bens primários a aceitar valores menores do que a 
média razoável de $50, quando se defrontam com um sorteio com a probabilidade de 0,5 de ganhar os $100 ou nada. Nestas 
circunstâncias, o pobre poderia contentar-se em receber $20 seguros, enquanto o rico arriscar-se-ia, possivelmente, à loteria, 
abrindo mão de $80 certos. Do ponto de vista de um mediador imparcial que fosse responsável pela divisão do prêmio entre os 
dois jogadores, seria injustificável racionalmente proceder a uma distribuição diferente de $50 para cada um, embora o ganho 
cardinal deste seja diferente individualmente. Isto é, para o pobre, metade de util, o que corresponderia na solução sem arbi- 
tragem ao ganho de $20. Já para o rico seria o mesmo que $80, devido à intensidade do desejo de possuir o bem em disputa. O 
pobre precisa mais do dinheiro, e por isso qualquer quantia seria bem-vinda, mas o rico, que já tem muito, pode se dar ao luxo 
de arriscar a ganhar mais, sem comprometer sua psicologia. 

54 HARSANTI, J. C. “Game and Decision Theoretic Models in Ethics”, p. 611. 





formação, a ponto de permitir a concepção de uma racionalidade mínima e intencio- 
nalidade capaz de incluir até bactérias e vírus”. 


Para a Teoria dos Jogos, um jogador é considerado racional se está motivado a 
maximizar seu próprio ganho, ou seja sua utilidade, sendo ainda hábil para calcular 
os resultados estocásticos (probabilísticos) de cada ação. Quando biólogos evolucio- 
nistas contemporâneos passam a utilizar modelos retirados desta teoria, no intuito de 
explicar o comportamento de determinadas espécies, estão interpretando essa racio- 
nalidade instrumental, agora, como uma capacidade de reunir informação e reagir em 
conformidade a esta. Ou seja, uma habilidade computacional do trato da comunicação 
que pode ocorrer mesmo no processamento de informação realizado por seres vivos 
através de reação de meras substâncias químicas. Pombos, falcões, bactérias ou vírus 
presentes em modelos virtuais ou em experimentos reais de laboratórios estão aptos a 
tomarem parte de um Dilema dos Prisioneiros Iterado (que se repete por várias vezes), 
graças a sua capacidade computacional de trabalhar as informações de entrada e rea- 
girem com uma resposta adequada**. 


Muitos biólogos, depois de Maynard Smith ter estabelecido uma “teoria dos jo- 
gos dinâmicos evolucionários” (o marco é o livro Evolution and the Theory of Games de 
1982), passaram a aplicar os novos recursos de análise matemática em pesquisas sobre 
linguagem, justiça (fairness) e direito de propriedade que até então ficavam restritos 
à especulação filosófica em suas diversas subáreas. Pela teoria dos jogos evolucioná- 
rios, as escolhas das ações seriam determinadas não pelo agente racional clássico, mas 
por estratégias específicas, cujo sucesso implicava no número maior de descendentes 
na futura geração. À partir desta concepção, uma estratégia evolutivamente estável 
(EEE, ou ESS, do inglês evolutionarily stable strategy) seria aquela que pudesse gerar 
condições de equilíbrio. Nenhum indivíduo portador dessa estratégia conseguiria in- 
crementar sua capacidade reprodutiva, se a trocasse por outra estratégia e nenhum 
mutante portador de estratégia rival diferente seria capaz de invadir a população na 
qual EEE prevalecesse”. 


Para uma estratégia ser considerada EEE, deve atender a duas condições quanto 
ao equilíbrio: seus resultados devem ser equivalentes aos pontos de equilíbrios estritos - 
ou seja, são as melhores respostas obtidas através de estratégias puras - e, por outra, 
a condição de estabilidade também deve ser satisfeita, isto é, as diferentes respostas às 
melhores estratégias dos outros são correspondentes as melhores respostas do agente”. 
Por conseguinte, estendida a um grupo vivente, de acordo com Richard Dawkins, uma 
EEE é a estratégia inata adotada pela maioria da população que não pode ser supera- 
da por uma outra estratégia invasora”. Da perspectiva evolutiva, não há necessidade 
de se considerar tais estratégias conscientes, basta as compreender como “programas 
de comportamento inconscientes estabelecidos pelos genes”. Tal concepção abrange 
desde o vírus Influenza e bactérias Escherichia coli até humanos (Homo sapiens). 


55 Neste sentido, muito contribuiu o trabalho do filósofo Daniel C. Dennett com textos sobre consciência que foram lançados 
a partir de Brainstorms (1978) e que culminam com Tipos de Mentes (1996). 

56 Veja LEWIN, R. Complexidade, cap. 1, pp. 167-169. 

51 Veja ROSS, D. “Game Theory”, à 6. 

58 Veja HAMMERSTEIN, P. & SELTEN, R. “Game Theory and Evolutionary Biology”, pp. 939-940. 

59 Veja DAWKINS, R. O Gene Egoísta, cap. 5, p. 94. 

60 DAWKINS, R. Op. cit. cap. 10, p. 206. 








Desse modo, o sucesso da Teoria dos Jogos Evolucionários permitiu explicar o compor- 


tamento de insetos e vertebrados, sem apelar para uma hipótese de racionalidade for- 
te, cujos testes de campo abalavam a tradicional teoria estática dos jogos. A partir do 
instrumental estruturado na teoria dos jogos original, a biologia evolutiva conseguiu 
analisar e prever as escolhas feitas por humanos dotados também desse tipo de racio- 
nalidade fraca que busca em primeiro lugar garantir a sobrevivência dos indivíduos e 
promover sua reprodução nas gerações futuras. As diferenças entre as espécies pode- 
riam, a partir de então, ser discriminadas tendo em vista a diferenciação de estratégias 
adotadas por grupo de genes que compõem determinado organismo, variando desde os 
maximizadores irrestritos aos “altruístas” maximizadores restritos. 


Maximizador Local e o Global 


Durante os dois milênios e meio que constituem a história da filosofia, os filósofos 
se ocuparam em definir os seres humanos como seres racionais, divergindo aqui e ali so- 
bre o grau e a categoria de raciocínio que este ente poderia exercer. Mas todos estavam 
de acordo que a racionalidade era algo que distinguia a espécie humana dos outros 
animais. Com a teoria dos jogos evolucionários essa distinção cai por terra, restando 
apenas o refinamento das estratégias como diferenciação entre agentes maximizadores 
irrestritos “egoístas” e aqueles capazes de restringir suas ações imediatas em função de 
um ganho maior no futuro. À irracionalidade humana passa a ser considerada um com- 
ponente real a ser investigado, como nos outros seres vivos, que torna todos passíveis 
de erros sem que as fronteiras das espécies sejam uma barreira natural a definir quem é 
quem cognitivamente. Trata-se afinal de genes que disputam o direito de continuarem 
existindo e se replicando por maior período de tempo possível, a bordo de “máquinas 
vivas”, fazendo uso dos mais diversos tipos de estratégias. 


Estratégias rotuladas como do “trapaceiro” ou do “rancoroso” - nos termos utili- 
zados por Dawkins em O Gene Egoísta (1976) - podem alcançar estabilidade em meio a 
uma população de seres que usem a estratégia do “tolo”. Imagine, como Dawkins fez, 
que os trapaceiros - seres que não cooperam nunca - invadam uma população tola, que 
coopera sempre, incondicionalmente. Qualquer que seja a quantidade de trapaceiros, 
desde que seja maior que um, prosperará e se multiplicar, explorando o trabalho dos 
tolos, até a exaustão destes, sem nada oferecer em troca. Tal estratégia será considera- 
da evolucionariamente estável ainda que leve a população de tolos à extinção, embora, 
em um território restrito, a morte do último tolo venha eliminar o próprio sustento dos 
trapaceiros, quando estes dominarem todo lugar, impedindo que outros seres portado- 
res de outras estratégias entrem em cena. Motivo pelo qual se considera a estratégia do 
trapaceiro imune à invasão. 


Diferente dos tolos, a estratégia “rancorosa”, apesar de cooperar sempre que a 
outra parte coopera, é capaz de retaliar o adversário, desertando, caso este não retribua 
com um ato de cooperação. Em meio aos tolos, os rancorosos prosperam tanto como 
estes em razão da cooperação mútua entre eles, passando mesmo despercebidos por 
um observador externo. Contudo, ao contrário dos tolos, os rancorosos são robustos o 
suficiente para repelirem a invasão de trapaceiros, posto que reagem contra a deser- 
ção destes, impedindo que proliferem em seu meio. Num ambiente em que convivam 
as três estratégias citadas, os rancorosos conseguirão manter-se em número razoável, 


enquanto os trapaceiros levam os tolos à extinção. Apesar da baixa na quantidade 








inicial de indivíduos, em função da exploração inicial sofrida, os rancorosos continu- 


ariam multiplicando-se, graças à cooperação mantida entre si. No instante em que 
sobressaíssem tão somente trapaceiros e rancorosos, os primeiros passam a conhecer a 
decadência e o gosto amargo da ingratidão, ao passo que os segundos começam a recu- 
perar suas perdas colaborando entre si e discriminando os trapaceiros. Deixados a sua 
própria sorte, os trapaceiros lutarão uns contra os outros até a morte ou, se possível, 
fugirão do local, que passa a ser dominado, afinal, pelos rancorosos”!. 


Pela teoria dos jogos evolucionários, a caracterização do agente racional inde- 
pende de sua configuração física ou ontológica. O que está em jogo entre os seres vivos, 
racionais ou não, é a capacidade de seguir uma regra, pôr em prática uma determi- 
nada estratégia que pode ter sido herdada ou adquirida pela experiência. Esta noção 
de agência aproxima-se muito da concepção dennettiana de postura intencional para 
“sistemas que modulam informações e buscam objetivos”*?. Quanto mais simples es- 
ses sistemas, mais próximos das macromoléculas orgânicas aptas à autorreplicação. 
Aumentando o grau de organização e complexidade, maiores são as chances desses 
sistemas intencionais poderem selecionar as melhores alternativas disponíveis. 


Seres humanos, portanto, devido ao seu alto grau de complexidade orgânica, 
diferenciam-se de outros viventes por sua capacidade de antever acontecimentos fu- 
turos, com maior nitidez, ao invés de estarem presos apenas aos fenômenos presentes. 
Na definição conveniente do sociólogo norueguês Jon Elster, humanos podem ser con- 
siderados como máquinas maximizadoras globais prontas a usarem estratégias indire- 
tas. Em outras palavras, são capazes de esperar por um momento mais favorável, no 
futuro, para tomarem decisões corretas, ao invés de optarem imediatamente por um 
resultado vantajoso momentâneo. Ao contrário das máquinas maximizadoras locais - 
os demais seres vivos -, os humanos não teriam de esperar por uma mutação genética 
aleatória para trocar de estratégia. Poderiam perfeitamente escolher entre um elenco 
variado de linhas de ação cultivadas por grupos sociais diversos no seio da espécie e ar- 
mazenada em sua memória histórica, além de contar com aquelas embarcadas no seu 
código genético ao longo da evolução. Por conseguinte, uma característica marcante 
da “racionalidade” humana está no trato estratégico do cenário em que se encontra, 
povoado por seres semelhantes que também podem reagir em função da avaliação das 
expectativas de ação dos demais atores relevantes, também dotados de conhecimento 
comum. Ao passo que um comportamento tipicamente paramétrico - como das outras 
espécies - adotaria a postura do indivíduo como sendo um único agente apto a variar 
seu comportamento em um meio constante que, serve de parâmetro fixo para suas 
ações. 


A teoria dos jogos evolucionários chamou atenção para alguns aspectos vitais 
da caracterização dos agentes racionais. Ao lado da teoria psicológica das perspecti- 
vas, desenvolvida por Kahneman e Tversky, traça um panorama realista da condição 
humana, ignorado historicamente pelos filósofos e economistas. Juntas, essas teorias 
alertaram, sobretudo, para o fato de que humanos, como qualquer ser vivo, estão ir- 
remediavelmente vinculados aos princípios biológicos fundamentais de sobrevivência e 
reprodução. Além disso, sustentou como válida a postura teórica de um individualismo 


61 Para os detalhes dessa bela fábula, veja DAWKINS, R. Idem, idem, pp. 206-208. 
62 DENNETT, D. C. Tipos de Mentes, cap.l, p.3l. 
68 ELSTER, ]. Ulises y las Sirenas, I, 88. 3 e 4, pp. 23-40. 








metodológico que deve partir de suposições egoístas, devido às limitações biológicas e 


restrições de recursos naturais, para só depois explicar o comportamento “altruísta” e 
a cooperação em grupos sociais. Por conta disso, a união entre Biologia Evolutiva e o 
modelo de jogos trouxe um maior poder descritivo à teoria dos jogos original. O conti- 
nente, antes habitado apenas por inúmeras variantes de Robinson Crusoé, tornou-se 
mais rico em diversidade de agentes racionais. O sentido de racionalidade ganhou, 
então uma versão mais precisa ao detectar as imperfeições psicológicas, cognitivas e 
morais dos sistemas intencionais. É a importância da aprendizagem ficou ainda mais 


clara para a espécie humana. 








Capítulo 2 
O Papel da Comunicação 


AS aqui, foram apresentados apenas os principais conceitos e alguns problemas 
relativos aos assuntos específicos da teoria da utilidade e da racionalidade dos 
jogadores. Mal foram abordados os pontos relacionados com jogos de múltiplos agen- 
tes e os leilões que são partes importantíssimas da teoria geral dos jogos”. Por “amor 
à simplicidade”, como é costume se dizer quando se procura explicar a teoria, esses e 
muitos outros aspectos específicos são aqui deixados de lado. Embora se reconheça a 
relevância destes temas, uma forçosa simplificação é-se obrigado a fazer quando em 
uma primeira introdução a qualquer assunto de interesse filosófico. Para oferecer o 
sabor da pesquisa detalhada e da aplicação da Teoria dos Jogos em outras áreas do 
conhecimento é que se falou da Teoria das Perspectivas, dos psicólogos Daniel Kah- 
neman e Amos Tversky, e da Teoria dos Jogos Evolucionários, da qual se destacou o 
trabalho do biólogo John Maynard Smith. 


Neste capítulo, outro campo particular da teoria será abordado com maior aten- 
ção. Os jogos com comunicação ou aqueles em que a comunicação exerce um papel 
crucial, pela sua presença ou ausência, são vistos mais de perto. A Teoria dos Jogos 
não foi a primeira, nem a última abordagem acadêmica a tentar elucidar a influência 


64 Kpenas como exemplo do alcance destas diversas classes de jogos que exigiriam um livro para cada uma delas, vale 
a pena citar rapidamente o jogo que Martin Shubik chamou de “O Leilão de Dólar”. Em um leilão ascendente no qual as partes 
pagam os seus lances, ganha o dólar quem oferecer a maior quantia, devendo também as inferiores serem pagas pelos demais 
participantes ao leiloeiro. Caso ninguém faça um lance, o dólar ficará com o leiloeiro. Se os interessados puderem comunicar-se, 
a cooperação forma-se em torno dos lances de US$ 0,01 e zero, quando dois jogadores enfrentarem o leiloeiro, que é obrigado a 
vender o dólar por um centavo ao jogador que, supostamente, repartirá os 99 centavos restantes com seu colega. Assim, o leilão 
termina logo no primeiro lance. Contudo, se a coalizão for proibida e o jogo desenvolvido em rodadas sucessivas indeterminadas, 
Shubik destaca que há dois pontos de equilíbrio em estratégia pura se um de cada oferecer um dólar enquanto o outro não fizer 
lance, respectivamente. De outro modo, as quantias positivas que forem feitas poderão levar o jogo a uma escalada sem fim, com 
a soma subindo muito acima do dólar oferecido. Alguém que ofereça um dólar poderá ser superado por US$ 1,05 de quem antes 
tivesse proposto 95 centavos. Deste modo, o segundo jogador reduziria as perdas dos 95, para apenas cinco centavos. Entretanto, 
0 primeiro poderia retrucar, superando esse lance para evitar perder um dólar, e assim por diante. No “mundo real”, um macabro 
jogo de escalada ocorreu durante a Guerra Fria (1945-1989), quando Estados Unidos e a antiga União Soviética aumentavam 
seus arsenais nucleares acima da capacidade de extinguir a vida no planeta. O “céu é o limite”, neste tipo de jogo! Descrições 
acessíveis sobre ele podem ser encontradas em SHUBIK, M. Teoría de Juegos en las Ciencias Sociales, cap. IX, 3 IX.4.1, 
p. 282 e em RAIFTA, H. El Arte y la Ciencia de la Negociación, cap VI, pp. 90-94. Além da comunicação, o papel do 
tempo e a psicologia dos agentes são fatores para saber quando parar em um ponto de equilíbrio que sirva de limite natural. 





da comunicação sobre o comportamento humano. Muitos filósofos de várias áreas de 
investigação - na lógica, na linguística, epistemologia e mesmo na ética - procuraram 
antes, durante e depois de Thomas C. Schelling explicar o fenômeno da comunicação. 
Para isso, diversos conceitos foram formulados e alguns princípios lançados, a fim de 
descrever com maior precisão os atos de fala e a linguagem humana. 


Apesar de poder-se encontrar estudos de filósofos precursores - a grosso modo, 
voltados para compreensão da linguagem em Platão, Santo Agostinho, Jean-Jacques 
Rousseau, entre outros -, a comunicação por ela mesma só veio a ocupar o foco das 
investigações no século XX, sobretudo depois do advento da radiodifusão e meios ele- 
trônicos de massa - rádio e cinema, no início; televisão, a partir dos anos 1950; e a 
rede mundial de computadores, no final do século passado. Em 1916, a publicação 
póstuma do Curso de Linguística Geral, do suíço Ferdinand de Saussure (1857-1913), 
procurou estabelecer um campo limitado para a linguística, associando-a à semiologia, 
linha de pesquisa que o próprio Saussure reservou para o estudo dos signos e seu uso 
social. Em seu domínio específico, caberia à linguística definir a função da língua no 
conjunto dos fenômenos semiológicos, em geral comunicativos”. A semiologia buscou, 
então, delinear a estrutura da linguagem a partir do signo, seu significado e signifi- 
cante, inaugurando o estruturalismo linguístico que abriu espaço a um melhor enten- 
dimento do processo comunicativo. O conjunto dos signos linguísticos constituiria a 
língua, um sistema de hábitos consolidados no tempo pelas forças sociais que permite 
aos indivíduos a compreensão mútua. Ao lado da fala, a língua formaria, por fim, a 
linguagem como um fenômeno mais abrangente. No esquema proposto por Saussure, 
a linguagem era subdividida em fala e língua, sendo esta última, por sua vez, dividida 
em parte sincrônica - que trata das relações lógicas e psicológicas dos termos em um 
sistema reconhecido pela coletividade - e diacrônica - onde as relações entre os termos 
são intercambiáveis, sem a forma de um sistema percebido pelo coletivo”. 


Essa tendência esquemática influenciou alguns autores, dos quais se destacou o 
linguista russo Roman Jakobson (1896-1982), cujos trabalhos sobre fonética definiram 
os conceitos de emissor, receptor, mensagem, código e canal. Desde Jakobson, que, 
no processo de comunicação, se entende o emissor como aquele que, de posse de um 
código - traços distintos que podem ser combinados segundo regras -, transmite uma 
mensagem - um conjunto de elementos portadores de informação - através de um canal 
- meio ou veículo pelo qual trafega a informação - para um receptor, aquele que recebe 
uma mensagem e a relaciona com um código comum ao emissor, decodificando e inter- 
pretando a informação”. O modelo de comunicação de Jakobson influenciou todos os 
campos de pesquisas que, a partir de 1962, de alguma maneira trataram do assunto, 
da antropologia à teoria matemática da informação, ainda que não adotassem plena- 
mente o ponto de vista estruturalista. 


Jakobson incentivou a generalização dos seus conceitos para domínios além da 
visão antropocêntrica da linguagem. Paralelo ao desenvolvimento da linguística, o 
desenvolvimento de máquinas inteligentes capazes de tratar a informação levou o es- 
tadunidense Norbert Wiener (1894-1964) a definir um novo ramo, em 1948, chamado 


65 Veja SAUSSURE, F. Curso de Linguística Geral, introdução, cap. III, 8 3, p. 24. 

66 Veja SAUSSURE, F. Op. cit. I part., cap. III, 8 9, pp. 115-116, para descrição detalhada de seu sistema. 

61 Todos esses conceitos estão definidos em JAKOBSON, R. Fonema e Fonologia, 1 part. seç. 1, 8 4, p. 60; 88 7 e Ta, 
p. 18 e II part. p. 115. 





por ele de cibernética - termo derivado do grego kybernetike, a arte da pilotagem, ou 
governo. À cibernética investiga o controle e a comunicação nos animais (incluindo os 
seres humanos) e as máquinas. Ao transmitir uma mensagem, o processo comunicati- 
vo cibernético exigiria que um sinal de retorno (retroalimentação) fosse recebido pelo 
emissor, a fim de permitir a correta compreensão de que a mensagem enviada, uma 
comunicação ou comando, fora adequadamente entendida e executada pelo receptor. 
A informação, aqui, representa o conteúdo trocado pelo emissor com o mundo exterior 
que o faz se ajustar a este de modo perceptível. A troca de informação seria, então, 
um processo de ajuste de quem se comunica “às contingências do meio ambiente e (...) 


efetivo viver nesse meio ambiente” *. 


Em Uma Introdução à Cibernética (1956), William Ross Ashby (1903-1972) apre- 
sentou alguns esclarecimentos sobre o propósito da cibernética. Esta seria uma teoria 
dos modos como todas máquinas possíveis se comportam, sendo, assim “essencialmen- 
te funcional e comportamental”?. Vinculada à teoria matemática da informação, a 
cibernética permitiu ampliar a discussão sobre o alcance da comunicação em horizon- 
tes não restritos aos seres humanos. À comunicação passou a ser concebida também 
independente do aparato transmissor, embora não totalmente, a ponto de prescindir 
de um estado orgânico que lhe preservasse o significado: 


as ordens de comando por via das quais exercemos controle so- 
bre nosso meio ambiente são uma espécie de informação que 
lhe transmitimos. Como qualquer outra espécie de informação, 
essas ordens estão sujeitas à desorganização em trânsito. Ge- 
ralmente, chegam a seu destino de forma menos coerente (...) 
do que quando foram emitidas. Em comunicação e controle, 
estamos sempre em luta contra a tendência da natureza de de- 
gradar o orgânico e destruir o significado; a tendência (...) de a 
entropia aumentar (WIENER, N. Cibernética e Sociedade, cap. 
1, p. 17). 


Além das questões sintáticas e semânticas da estrutura da linguagem e da comu- 
nicação, a cibernética chamou atenção para aspectos funcionais e do comportamento 
retroalimentado, que na filosofia da linguagem têm paralelo com a perspectiva prag- 
mática e de ação social. O âmbito no qual o austríaco Ludwig Josef Johann Wittgens- 
tein (1889-1951) definiu o conjunto da linguagem como sendo jogos de linguagem, ou 
seja “todo processo de uso das palavras” em que alguém age de acordo com as palavras 
que o outro pronuncia”. Essa nova visão, estimulou autores como o britânico John 
Langshaw Austin (1911-1960) e John Richard Searle a considerarem que os falantes 
de uma língua, em todos aspectos da comunicação, exercem ações linguísticas. Toda 
essa produção e emissão de frases corresponderia a uma função distinta - ameaças, 
promessas, nomeação etc. -, regida por um elenco de regras respectivas”. A vincula- 
ção do estudo da linguagem a sua função comunicativa proporcionou a abordagem de 
outras questões ligadas ao comportamento de quem se comunica. Ao debate sobre a 


68 WIENER, N. Cibernética e Sociedade, I, pp. 11 e 18, para essa citação e toda descrição feita da cibernética. 

69 ASHBY, W. R. Uma Introdução à Cibernética, cap. 1, 8 1.2, p. 1. 

10 WITTGENSTEIN, L. Investigações Filosóficas, $ 7, p. 12. 

tl Alguns critérios foram lançados por AUSTIN, ]. L. Quando Dizer é Fazer, V conferência, pp. 51-65 e SEARLE, ]. R. 
Os Atos de Fala, 1 part, cap. 3, pp. 13-95. 








comunicação, somou-se os esforços de Karl-Otto Apel e Habermas em tentar caracte- 


rizá-la como campo apropriado para o estabelecimento de normas válidas moralmen- 
te, alargando ainda mais a compreensão que se tinha sobre o papel da comunicação na 
vida de todos”. 


Nesse contexto de rica discussão acadêmica sobre a comunicação, a Teoria dos 
Jogos se insere como um instrumento a mais para ajudar esclarecer pontos que ficaram 
obscuros em uma abordagem ou outra e ajudar estabelecer contatos que aparente- 
mente eram, de início, vistos como incompatíveis entre ramos de investigação opostos 
- por exemplo a Teoria Crítica da chamada Escola de Frankfurt e a Teoria da Escolha 
Racional. Quando a comunicação passou a ser entendida como ação para transmitir 
informações entre duas ou mais partes, com uma estrutura própria e finalidade que 
não se esgota no entendimento do significado da mensagem, mas exige a realização de 
seu conteúdo linguístico, para ser mantida, seus fins instrumentais puderam ser for- 
malmente tratados como uma ação comunicativa que visa mudar o estado do mundo 
em favor de quem comunica, em primeiro lugar. 


Comunicação na Teoria dos Jogos 


Wittgenstein, desconhecendo completamente a Teoria dos Jogos, chamou o pro- 
cesso de uso das palavras, que envolveria desde a denominação dos objetos, a apren- 
dizagem da língua materna e a repetição ostensiva dos termos pronunciados, de jogos 
de linguagem. Sua interpretação pragmática deste conceito ressaltava o papel comu- 
nicativo do processo linguístico, dependente da interação entre parceiros que agem 
de acordo com o que fora pronunciado. Tal acordo, para ser fiel a Wittgenstein, faria 
parte da forma de vida dos participantes, capazes de entender as regras adequadas 
às diversas maneiras em que a linguagem pode ser “jogada”. Este aspecto interativo 
que torna a linguagem uma atividade comum aos falantes é partilhado também pela 
Teoria dos Jogos, na sua definição básica de jogos estratégicos como sendo aqueles em 
que as ações exercidas são escolhidas em função da reação esperada da outra parte 
envolvida. Diz respeito também ao ponto crucial da comunicação na visão da ciberné- 
tica, onde a resposta adequada do ouvinte, retroalimentando o processo comunicativo, 
permite o controle do emissor sobre a justeza da informação transmitida. Em suma, 
em todo o processo comunicativo, a “audição” da voz do outro é o ponto central para 
que o “jogo da linguagem” seja bem-sucedido na sua concepção mais ampla. 


A comunicação, do ponto de vista pragmático da linguagem e da Teoria dos 
Jogos, tem, portanto, uma tarefa decisiva para solução dos problemas dos falantes. 
Entretanto, convém lembra que embora a classificação dos jogos em cooperativos e 
não-cooperativos dependa por definição da comunicação, como já foi destacado no 
primeiro capítulo, jogos de soma zero com informação perfeita, entre duas partes, po- 
dem dispensar por completo o seu emprego. Isto porque, aquele jogador que encontrar 
primeiro sua estratégia vitoriosa fatalmente a usará contra o seu adversário obtendo a 
vitória, ou pelo menos o empate (isto é zero util), posto que em jogos de soma zero en- 
tre dois jogadores um deve vencer e o outro perder, caso contrário ambos nada ganham 
ao final. 


12 Sobre o conteúdo moral da discussão argumentativa é particularmente esclarecedora a leitura de HABERMAS, ]. Er- 
lãuterungen zur Diskursethik (Esclarecimentos sobre a Etica do Discurso). 








No texto inaugural da teoria dos jogos contemporânea, Von Neumann e Mor- 
genstern enfocavam sobretudo os jogos de soma zero com n-jogadores, sob o argumen- 
to de que os jogos de soma variável poderiam ser transformados em soma constante 
pela simples adoção de um jogador a mais que absorvesse as perdas ou os ganhos em 
jogo. Admitiam também que a comunicação fosse partilhada naturalmente em jogos 
com múltiplos participantes que poderiam, então, cooperar uns com os outros na for- 
mação de coalizões que imputassem uma solução aos jogos. Nos jogos cooperativos, a 
coalizão mais forte venceria a mais fraca segundo uma distribuição adequada dos ga- 
nhos entre os membros desta coalizão. O que não quer dizer que uma coalizão tivesse 
de ser formada necessariamente por jogadores fortes e poderosos. Uma coalizão ven- 
cedora poderia ser aquela que tivesse como participante o elemento mais fraco, desde 
que se conformasse em receber uma parte conveniente dos ganhos. 


A abordagem sugerida por Von Neumann e Morgenstern desde 1944, define so- 
lução como uma imputação na qual a distribuição dos bens garante pelo menos a cada 
integrante da associação o recebimento de um mínimo equivalente ao que conseguiria 
se agisse por conta própria, sem tomar parte da união. Um conjunto de imputações é 
uma solução quando nenhuma distribuição de pagamentos interna domina a outra e, 
além disso, nenhuma imputação externa é preferida em relação ao conjunto formado”. 


Para ilustrar isso, vem a calhar um exemplo esclarecedor de Rapoport. O con- 
junto de imputações: 


S=[(50, 50, 0): (50, 0, 50); (0, 50, 50)], 


que distribui $100 por três jogadores é uma solução, pois nenhuma imputação entre 
elas é preferida ou pode ser dominada por outra de fora - como (60, O, 40), que seria 
preterida por (0, 50, 50), a preferida pelos segundo e terceiro jogadores”. Aqui, a co- 
municação levaria dois jogadores a repartirem igualmente entre si o montante ofereci- 
do, deixando de fora o terceiro elemento que nada ganha, posto que o pouco que ganhe 
terá de ser retirado de algum outro jogador da coalizão majoritária que, por princípio, 
não abrirá mão de seus $50. De um modo geral, nos jogos cooperativos com muitos 
Jogadores, a comunicação exerce a função de coordenadora das ações, a fim de que as 
coalizões sejam formadas, dentro do conceito de solução, como conjunto de imputa- 
ções, embora não defina qual coalizão será a vencedora. 


Da maneira que fora posta por Von Neumann e Morgenstern, a partir de 1944, a 
comunicação era tida como característica distintiva dos jogos cooperativos, onde uma 
rodada prévia de troca de informações era permitida. Em jogos não cooperativos e es- 
tritamente competitivos (soma zero), entre dois jogadores, sua presença seria, de fato, 
totalmente desnecessária quando a informação fosse perfeita - xadrez, velha, damas 
etc. Nos jogos de informação imperfeita, por sua vez, seu papel restringir-se-ia ao uso 
do blefe, isto é fazer passar ao outro a falsa impressão de força ou fraqueza, no intuito 
de induzir o oponente a desistir de executar uma determinada estratégia por causa 
dessa informação confusa. Neste sentido, a comunicação atuaria como uma sinaliza- 
ção de um falso comportamento que visaria gerar incerteza e, por conta disso, limitar 
as escolhas do adversário. Vale dizer que a comunicação não serviria como fonte de 
soluções, mas de ardil restrito aos jogos de informação imperfeita, e que somente uma 


73 Veja Von NEUMANN, J. & MORGENSTERN, 0. Theory of Games and Economic Behavior, cap. VI, 8 30.1.1, p. 264. 
14 Veja RAPOPORT, A. Lutas, Jogos e Debates, cap. XII, p. 156. 








mistura de estratégia adequada, como a maximin representa uma resolução para tais 
tipos de jogos entre duas pessoas”. 


As coalizões que surgem nos jogos cooperativos com n-pessoas, indicam a neces- 
sidade de negociação para que haja um efetivo encontro de um conjunto de imputações 
que constituam a solução do jogo. No caso de apenas dois jogadores, a solução coopera- 
tiva será aquela que encontrar o par de ganhos que garanta a cada uma das partes ao 
menos aquilo que elas poderiam assegurar jogando sozinhas. Chegar-se-ia a este resul- 
tado depois de descartados todos os outros pares que não atendessem a esse requisito 
mínimo. Contudo, como afirmaram Luce e Raiffa, achar o melhor resultado em um 
conjunto de negociação com muitos pontos possíveis depende de aspectos psicológicos, 
relevantes no contexto de uma barganha, e que estão fora da matemática”. 


Problemas de Barganha 


Uma tentativa de solucionar matematicamente o problema da barganha foi ela- 
borada por John Nash, em 1950, nos artigos “The Bargaining Problem” e “Non-coope- 
rative Games”. Nash partiu da suposição de que se poderia reduzir os jogos cooperati- 
vos (com comunicação prévia) à forma não cooperativa. Para isso, bastaria que fosse 
construído um modelo em que a negociação prévia teria suas etapas transformadas em 
um jogo não-cooperativo com uma quantidade infinita de estratégias puras que repre- 
sentariam toda situação. A solução obtida para este jogo “alargado”, por conseguinte, 
corresponderia ao valor obtido em um jogo cooperativo equivalente”. Pelo “programa 
de Nash”, a solução de um jogo não-cooperativo, quando houvesse, seria um par de 
equilíbrio único, considerando que cada indivíduo deseja maximizar sua utilidade; que 
o acordo obtido se torna obrigatório por não poder ser superado por nenhum outro 
alternativo, dentro do mesmo conjunto de negociação compacto e convexo, geometri- 
camente; e que ambos jogadores tenham a mesma habilidade de barganha. A solução 
de Nash, em jogos com barganha, equivale ao ponto de equilíbrio que corresponde ao 
máximo de todos produtos de utilidade maiores que zero. Na divisão de $100 entre 
dois jogadores, por exemplo, a solução de Nash é (50, 50), desde que a utilidade seja 
assumida como linear, do mesmo modo que o dinheiro. Nenhum outro par de coorde- 
nadas, dentro da região de resultados possíveis desenhada no gráfico da Figura 2.1, 
pode oferecer um produto de suas utilidades que seja superior a 2500. 


Figura 2.1 
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(50, 50) 
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Utilidade da Linha 


15 Uma análise detalhada do blefe, em uma variante de pôquer simplificada, pode ser encontrada em Von NEUMANN, J. & 
MORGENSTERN, 0. Op. cit., cap. IV, 38 19.1 a 19.16, p. 186-219, que é uma resposta ao problema original tratado por BOREL, 
E. “Le Jeu du Poker”, in Traité du Calcul des Probabilités, et de ses Applications, vol. IV, 2, cap. 5. 

16 Veja LUCE, R. D. & RAIFFA, H. Games and Decisions, cap. 6, 8 6.2, p. 118. 

1 Veja NASH, ]. “Non-cooperative Games”, in Essays on Game Theory, p. 295. 





Matematicamente, a justeza do programa de Nash é indiscutível. Entretanto, a 
maneira pela qual o conceito de barganha é definido pode ser discutida. Sua suposição 
de que, em uma negociação, os indivíduos sejam “altamente racionais, possam compa- 
rar detalhadamente seus desejos pelas coisas, sejam igualmente capazes de negociar e 


tenham pleno conhecimento dos gostos e preferências do outro”? 


restringe o contexto 
da barganha a situações de informação completa onde haja o pleno conhecimento co- 
mum das preferências por parte dos jogadores. Barganhas com informação incompleta 


permanecem um desafio para os teóricos. 


Outro modelo de negociação lançado nos anos 1980 por Ariel Rubinstein permi- 
tiu analisar a troca de ofertas alternadas entre os jogadores, levando em conta o grau 
de impaciência dos jogadores (o desejo destes anteciparem o final do jogo). Isto é, em 
um jogo sequencial - quando os jogadores tomam decisões em rodadas sucessivas e em 
determinada ordem de movimentos - a alternância de ofertas chegará a uma solução se 
esta representar um equilíbrio perfeito em seus subjogos. Um subjogo é qualquer parte 
de um jogo na forma extensiva que se inicia em um único nó de decisão e forma um 
conjunto completo de nós e ramos que sucedem a este nó. Eventualmente, um subjogo 
apresenta um nó terminal em equilíbrio de Nash, cuja combinação de movimentos que 
leva ao ponto de equilíbrio não apenas em todo jogo estendido, mas também em cada 
subjogo existente na árvore original. Quando isto acontece o ponto é considerado de 
equilíbrio perfeito em subjogos. 


Um jogo de negociação simplificada para divisão dos $100, sob o modelo de Ru- 
binstein, ilustra como esse equilíbrio seria encontrado entre dois jogadores pacientes 
ou com graus diferentes de impaciência. Ambos devem resolver essa divisão no máxi- 
mo em três rodadas, sendo que o primeiro tem um grau de impaciência “|” e o segundo 
“e”, que devem descontar os ganhos futuros como uma taxa para cada rodada. Além 
disso, caso um jogador tenha um ganho igual nas opções oferecidas em um determina- 
do ponto de decisão, ele preferirá a alternativa que oferecer maior ganho para o adver- 
sário, do contrário, se não houver acordo, ambos nada ganharão. À figura 2.2 mostra 
como esse jogo finito de ofertas alternadas com impaciência, registra na primeira ro- 


dada a aceitação da oferta, como equilíbrio de Nash perfeito. 
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(100, 0) (0, 0) 





18 NASH, ]. “The Bargaining Problem”, in Essays on Game Theory, p. 155. 








Pelo modelo de negociação de Rubinstein, é possível analisar diversas situações 
variantes desde quando é jogado em apenas uma etapa até um jogo infinito com um 
número indeterminado de rodadas. Na versão de uma etapa, também conhecida como 
Jogo do Ultimato, testes empíricos mostraram que a maioria das ofertas do primeiro 
jogador (Linha) aproxima-se da oferta justa (50, 50), que seria a solução no modelo 
de negociação de Nash. Em geral, as ofertas menores do que 30% arranhavam a re- 
putação do segundo jogador (Coluna) que prefere a recusar ao invés de aceitar uma 
proposta indecorosa. A previsão teórica, no entanto, baseada na suposição de agentes 
egoístas, seria de que qualquer oferta, por mais ínfima que fosse deveria ser aceita por 
parte de Coluna, tal como é o espírito da interpretação que sugere ser a opção por (100, 
0) preferida sobre (0, 0), como qualquer quantia muito pequena oferecida próxima de 
zero, semelhante a um centavo para Coluna e $99,99 para Linha”. 


Num jogo extensivo finito, o equilíbrio de Nash é buscado através de indução 
reversa, também conhecida como algoritmo de Zermelo em jogos sequenciais com infor- 
mação perfeita, ou ainda pelo nome pomposo de procedimento padrão de programação 
dinâmica. Partindo das “folhas” - pontos terminais - até a “raiz” - ponto inicial -, em 
cada “nó” - ponto de decisão - de um jogador, escolhe-se o “ramo” - movimento - que 
leva ao subjogo que lhe ofereça o maior ganho. Uma vez encontrado o ponto de equi- 
líbrio que represente uma solução para o subjogo original e todos os outros na mesma 
árvore, ter-se-á achado o equilíbrio de Nash perfeito dos subjogos. Assim, a divisão dos 
$100 em três lances de oferta, contraoferta e oferta final faz com que Linha proponha 
ficar com tudo ou nada para ambos como sua última proposta. Considerando o grau de 
impaciência da Linha que varia entre 0 e 1, Coluna, sabendo que na última etapa ele 
corresponderá a 1 (o total em jogo), prefere ganhar 1 - le oferecer la Linha, que na pe- 
núltima etapa seria um pouco menor que um (devido à taxa de desconto), a ficar sem 
nada no final. Contudo, para evitar chegar nessa fase, Linha pode preferir explorar a 
impaciência de Coluna, oferecendo-lhe de imediato c - algo maior que O e menor que 
1- multiplicado pelo que ganharia depois (1 - 1). Destarte, considerando a impaciência 
dos dois, a negociação em torno dos $100 os dividiria a uma proporção que desse 1 - c(l 
- 1) para Linha e c(1 - 1) à Coluna, logo no primeiro lance”. 


Em uma variante mais ampla da barganha, para chegar-se ao equilíbrio perfeito 
de subjogos em negociações com infinitas alternâncias de ofertas, não é possível se re- 
correr à indução reversa. Nestes casos, o modelo de Rubinstein prevê que o equilíbrio 
perfeito ficaria na proporção da divisão oferecida pelo primeiro jogador (Linha) que 
propusesse para o segundo jogador (Coluna) 


e(1-1/1-cl 
eo próprio ofertante ficasse com 
1-c/l-cl 


desde que seus graus de impaciência estivessem entre O e 1, sendo ambos indiferentes a 


19 Para ser justo com Rubinstein, KREPS, D. M. Game Theory and Economic Modelling, cap. 5, pp. 125-126 lembra 
que em seu artigo de 1982 (“Perfect Equilibria in a Bargaining Model”), Rubinstein observara que jogos de negociação 
com alternância de ofertas que tenham muitos equilíbrios de Nash, há um único equilíbrio livre de ameaças que está próximo 
da divisão meio a meio. 

80 Veja VARIAN, H. R. Microeconomia, cap. 29, 8 29.1, pp. 513 e ss. 





aceitar ou rejeitar uma oferta feita”. 


Tudo isso e mais alguma coisa que não foi dita, mas será apresentada no momen- 
to oportuno, é o que acontece nas negociações tendo em vista os modelos de Nash e 
Rubinstein. Contudo, embora a comunicação seja um elemento-chave da barganha, 
não é plenamente considerada nesses contextos que apenas a supõem. Os efeitos da co- 
municação na negociação começam a aparecer com maior destaque quando se observa 
um jogo sugerido por Thomas Schelling que propõe a divisão dos $100 simultaneamen- 
te por dois jogadores, mas sem a possibilidade de troca de informação. Caso a soma das 
pretensões dos dois viesse a ser menor ou igual a $100, ambos ganhariam a respectiva 
quantia acertada. De outro modo, nada receberiam”, 


Nestas circunstâncias, Schelling revela que 36 das 40 pessoas que participaram 
do teste, nos anos 1950, decidiram ficar com $50. A resolução do problema de coorde- 
nação da divisão dos $100 levou a busca pela única resposta que entre outras tantas 
poderia servir como coordenadora, mesmo que os interesses divergentes de ambos fosse 
uma dificuldade quase intransponível para o encontro de uma solução “justa”, numa 
barganha explícita. A ausência de comunicação, tacitamente gerou a divisão equili- 
brada por meio de linhas de ação comuns entre os agentes. De fato, como interpreta 
Schelling, o foco na divisão meio a meio deveria ser creditado a padrões éticos, opinião 
pública ou algum mecanismo precedente partilhado em comum pelos jogadores*. Ele- 
mentos aos quais também podem ser creditados os resultados próximos à oferta “jus- 
ta” que ocorrem no Jogo do Ultimato - quando a barganha deve ser decidida em uma 
etapa de oferta. O conceito de ponto focal foi defendido por Schelling como principal 
ferramenta na barganha tácita e um dos principais na negociação explícita, onde os 
participantes precisam convergir suas expectativas. “Pontos focais” serviriam como 
sinais claros que pudessem ser lidos sem ambiguidade. 


Além da Negociação 

Muitos outros conceitos, além daqueles trabalhados na barganha, foram elabo- 
rados por teóricos dos jogos que se debruçaram sobre o papel da comunicação na solu- 
ção de desafios estratégicos. De um modo geral, jogos com comunicação foram definidos 
como sendo aqueles em que, além das opções de estratégicas puras especificadas na 
estrutura do jogo, é possível aos jogadores fazer uso de uma série de alternativas im- 
plícitas que permitem a comunicação entre eles. As partes não precisam sequer assinar 
contratos, bastando apenas que possam falar”. Instrumentos como mediador, sina- 
lização, credibilidade, neologismo, conversa barata (cheap talk), entre outros conceitos 
podem ser decisivos para a análise correta desse tipo de jogo. 


A partir dos testes realizados por Schelling, percebeu-se que os movimentos dos 
Jogadores pelos ramos de um jogo na forma extensiva não eram suficientes para des- 
creverem a riqueza de possibilidades que a comunicação pode produzir quando os jo- 
gadores entram em contato uns com os outros. À inserção da comunicação em suas 
estratégias implícitas permitiu modelar jogos cujo estudo apresentaram em detalhes 


81 Duas apresentações didáticas diferentes do mesmo resultado de Rubinstein podem ser encontradas respectivamente em 
FIANI, R. Teoria dos Jogos, cap. 5, p. 132 e VARIAN, H. R. Op. cit. cap. 29, 3 29.1, pp. 515. 

82 Veja SCHELLING, Th. C. The Strategy of Conflict, cap. 3, p. 61. 

88 Veja SCHELLING. Th. C. Op. cit. cap. 3, pp. 66 e ss. 

84 Ver MYERSON, R. B. “Communication, Correlated Equilibria and Incentive Compatibility”, p.928. 








os efeitos das ameaças e promessas - quando são críveis ou não, bem como as respostas 
plausíveis que as evitem ou tornem vinculantes -, além do refinamento dos equilíbrios 
para coordenação de expectativas. Neste contexto, merecem destaque os trabalhos de 
Robert J. Aumann (Nobel de economia em 2005), Roger Bruce Myerson, Joseph Far- 
rell, David M. Kreps e Joel Sobel, entre outros que ajudaram a construir uma Teoria 
dos Jogos capaz de tratar dos problemas da comunicação à altura das tradicionais te- 
orias acadêmicas sobre o assunto. A ponto de servir como uma ponte entre concepções 
de racionalidade estratégica e comunicativa, na filosofia. 


Por outro lado, a concepção naturalista da comunicação, por sua vez, demanda 
que esta possa ser entendida como um desenvolvimento biológico que trouxe algum 
tipo de vantagem em termos de sobrevivência e reprodução para o indivíduo. À comu- 
nicação não poderia, então, existir sem que fatores materiais evidentes concorressem 
para isso. Entendida como uma ação que visa transmitir informações entre duas ou 
mais partes, a comunicação tem uma estrutura própria e um fim que não se esgota no 
entendimento do significado da mensagem, mas exige a realização de seu conteúdo 
linguístico, para ser mantida. O que vale dizer que a ação comunicativa se estende 
a seus fins instrumentais: mudar o estado do mundo em favor de quem comunica. 
Essa é uma das extensões do sentido de controle e comando apontado pela cibernética 
como essencial ao processo comunicativo, pois, para que o emissor saiba que sua in- 
formação foi corretamente compreendida pelo ouvinte, se requer que este o responda, 
executando uma ação correspondente”. Assim, a matéria sobre a qual a comunicação 
trabalha depende dos interesses individuais, que não se reduzem ao emprego correto 
de “pressupostos pragmáticos” - como quer a Teoria do Agir Comunicativo da qual se 
falará adiante. Para que tenha significado e credibilidade se faz necessário um “conhe- 
cimento comum” perene do jogo de linguagem praticado. A seguir, toda essa discussão 
será observada mais de perto, começando pela apresentação dos conceitos utilizados 
na pesquisa em torno dos jogos com comunicação. 


$4. Informação Perfeita, Ameaças e Outros Conceitos 


A formalização matemática dos modelos de negociação de Nash e Rubinstein, 
além de suas variantes e dos modelos de Harsanyi-Zeuthen”, só foi possível depois 
que o próprio John Nash se propôs interpretar a capacidade de negociar de uma ma- 
neira diferente da que havia sido traçada por Von Neumann e Morgenstern. Antes, as 
dificuldades percebidas para a descoberta de um resultado único para um processo de 
barganha decorriam do fato de se considerar imponderável a capacidade de negociação 
dos agentes. Por causa disso - como conta Kenneth George Binmore, na introdução aos 
Essays on Game Theory, de John Nash*” -, a solução para os jogos cooperativos estava 
voltada para formação de coalizões em um conjunto de resultados que representassem 
a distribuição dos ganhos entre os participantes. O que significa que, da perspectiva 
dos jogos cooperativos, neste tipo de imputação, os jogadores atuariam no sentido de 
08 Veja WIENER, N. Op. cit., cap. 1, p. 16. 

86 Uma introdução acessível aos modelos de barganha não-cooperativa pode ser encontrada em BINMORE, K., OSBORNE, M. 
]. & RUBINSTEIN, E. “Noncooperative Models of Bargaining”, in AUMANN, R. J. & HART, S. Handbook of Game 
Theory, vol |, cap. 1, pp. 181-225. Outros que propuseram modelos de negociação tendo por base a teoria dos jogos cooperativa 
foram Kalai-Smorodinsky e Maschler-Perles. Descrição sumária dos modelos de Kalai-Smorodinsky e Maschler-Perles pode ser 
lida em SHUBIK, M. Teoría de Juegos en las Ciencias Sociales, VII, 39 6.1 e 6.2, pp. 192-196. Muitos detalhes, como 


desconto, risco, pagamentos laterais, negociação com múltiplos agentes, entre outros, não poderão ser discutidos aqui. 
81 Veja BINMORE, K. “Introduction”, in NASH, ]. F. Essays on Game Theory, p. XIII. 








descartar todos pares de pagamentos conjuntos dominados por outro ou ao menos o 
que cada um pudesse obter sem participar da cooperação. A solução é entendida, en- 
tão, como o conjunto das imputações impossível de ser dominado internamente, entre 
si, nem externamente, por outra escolhida fora do conjunto”. 


Os jogos cooperativos pressupõem que os jogadores possam coordenar seus pla- 
nos, se ameaçarem e fazerem promessas, em um processo de barganha fora das re- 
gras formais do jogo. Neste sentido, Luce e Raiffa destacaram que a seleção de um 
resultado entre a multiplicidade de pontos em um conjunto de negociação dependeria 
de “certos aspectos psicológicos dos jogadores que são relevantes para o contexto de 
barganha”?”. Von Neumann e Morgenstern pensavam fornecer a primeira abordagem 
matemática apropriada para a sistematização das condições psicológicas do problema 
da barganha, quando tratavam a negociação a partir da perspectiva dos jogos coo- 
perativos. Entretanto, Nash não se satisfez com a constatação de que a solução para 
o problema da barganha fosse indeterminada e imaginou que os jogadores poderiam 
ser dotados de técnicas de negociação melhores para a situação em que eles se acha- 
vam, ao invés de supor um negociador racional idealmente mais habilidoso do que um 
outro. Desse modo, a solução cooperativa de Von Neumann e Morgenstern passou a 
ser interpretada sob a ótica dos mesmos fins básicos que subjazem à teoria dos jogos 
cooperativos e não-cooperativos, embora nem sempre a visão da negociação como jogo 
não-cooperativo possa ser reproduzida na realidade. 


Por sua vez, Ken Binmore, Martin Osborne e Ariel Rubinstein consideram que 
tanto a teoria dos jogos cooperativos como a dos não-cooperativos podem ser compre- 
endidas como complementares, pois, por ser mais ampla, a interpretação cooperativa 
da negociação apresentaria o conjunto de soluções que, apesar de indeterminado e 
genérico, permitiria ao modelo da barganha não-cooperativa apontar especificamente 


em quais contextos o conceito de solução é aplicável”? 


« O que de certo modo, permite 
Shubik argumentar que o uso dos termos “cooperativos” ou “não-cooperativos” é ina- 
dequado, uma vez que a descrição das situações por regras formais não traz imanente 


a cooperação ou não-cooperação”. 


A despeito dessa diversidade de opiniões, em Two-Person Cooperatives Games 
(1950), Nash procurou mostrar como se poderia reduzir o jogo cooperativo a um jogo 
não-cooperativo, onde a comunicação das etapas de negociação ocorresse em movimen- 
tos sequenciais, representados na forma extensiva. Para tanto, cada jogador teria de 
possuir informação completa da estrutura do jogo e da função de utilidade de seu opo- 
nente, sendo ambos indivíduos plenamente racionais. O que vale dizer que todos jo- 
gadores sabem que cada um tem o conhecimento comum (informação partilhada pelos 
envolvidos) de todas as suas respectivas estratégias e ganhos, durante todo o desenro- 
lar do jogo. Assim, cada um sabe quantos participam do jogo, as decisões que podem 
tomar e as suas recompensas esperadas”. Além disso, na evolução do jogo, cada jo- 
gador tem a informação perfeita sobre qual ponto de decisão, nó do jogo extensivo, se 
encontra, isto é, na sua vez de escolher o que fazer o agente sempre sabe o que os outros 
fizeram até aquele momento. 


88 Veja VON NEUMANN, J. & MORGENSTERN, 0. Theory of Games and Economic Behavior, cap. 1, $ 4.5, pp. 39-40. 
89 LUCE, R. D. & RAIFFA, H. Games and Decision, cap. 6, 8 6.2, p. 118. 

90 Veja BINMORE, K., OSBORNE, M. J. & RUBINSTEIN, A.0p. cit., vol 1, cap. 1, pp. 181-182. 

91 Veja SHUBIK, M. Op. cit. 9 IX.I, p. 292, n. 1. 

92 Veja NASH, ]. F. “Two-Person Cooperative Games”, in Essays on Game Theory, pp. 129-130. 








A perfeição e completude das informações disponíveis permitem aos jogadores 
racionais encontrar por meio do procedimento da indução reversa o equilíbrio perfeito 
do jogo, antes mesmo de executarem suas ações. O Jogo da Centopeia - desenhado na 
figura 2.3 - serve como exemplo de revelação dos efeitos desses conceitos quando anali- 
sados sob este método. Partindo do último movimento, a melhor escolha de Coluna se- 
ria “esquerda” que lhe proporciona um util a mais do que a “direita”. Contudo, Linha 
prevendo que isto poderia acontecer na penúltima rodada, dobraria à “esquerda”, ga- 
rantindo 99 para ambos. Porém, antes que isso viesse ocorrer Coluna já teria desviado 
à “esquerda” que lhe pagaria 100, ao invés de se arriscar aos 99. Descendo assim a ár- 
vore, a centopeia chegaria às primeiras etapas, onde, seguindo sempre pela “direita”, 
se voltaria à raiz no momento em que Linha já sabendo de tudo que iria se desenrolar, 
decide escolher a estratégia da “esquerda”, de modo que em vez de conseguirem (100, 
100) os jogadores da centopeia acabam por conseguirem apenas (1, 1). 


Figura 2.3 - Jogo da Centopeia 
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A perplexidade diante do paradoxo da centopeia é mais uma entre tantos para- 
doxos apresentados pela Teoria dos Jogos e decorre das premissas de racionalidade e 
maximização da utilidade que foram apontadas antes. Mas outros fatores contribuem 
para sua previsão teórica afronte as intuições do cotidiano. Desde quando Robert W. 
Rosenthal (1945-2002) apresentou o primeiro estudo sobre a “centopeia” - no artigo 
“A Model in which an Increase in the Number of Sellers Leads to a Higher Price” (“Um 
Modelo no qual um Incremento no Número de Vendedores Leva ao Preço Superior”, 1980) 
-, Vários testes empíricos indicaram que raramente o primeiro jogador escolhe o equilí- 
brio perfeito descoberto através da indução reversa? O conhecimento comum que todos 
os jogadores partilham entre si das informações relevantes sobre o outro, somado ao 
prazo finito da interação e a plena consciência das informações que estão em jogo faz 
com que, teoricamente, a busca pelo menor risco leve a um resultado mínimo, mas se- 
guro, na perspectiva de quem tem uma reputação a preservar. Na prática, entretanto, 
a imperfeição da informação pode levar a resultados melhores, na Centopeia, devido à 
incerteza quanto ao final do jogo ou sobre a personalidade do oponente. A informação 
imperfeita evitaria assim que a indução reversa pudesse ser aplicada. Como foi dito, a 
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indução reversa é o método mais prático para encontrar, em um jogo extensivo - uma 
árvore de Kuhn -, o equilibrio perfeito de um subjogo válido para todos os outros subjo- 
gos e para toda árvore original. Basta apenas que se descubra a folha que representa 
o par de ganhos em equilíbrio para os jogadores, sendo o resultado superior daquele 
que fez o último movimento correspondente a sua sub-árvore. No jogo da Centopeia, o 
equilíbrio perfeito recai sobre (1,1) logo no primeiro movimento do primeiro jogador 
que dá início a ele. As maneiras pelas quais se pode ter acesso às alternativas melhores 
na Centopeia e os modelos de jogos dessa família serão expostos no terceiro capítulo. 
Por enquanto, outros conceitos relacionados com a comunicação precisam ser intro- 
duzidos. 


Os Conceitos dos Jogos com Comunicação 


Embora o modelo de negociação de Nash seja formal ao extremo de praticamen- 
te ignorar a cooperação gerada pela comunicação prévia - lembre-se que ele reduziu 
os jogos cooperativos aos não-cooperativos em seu programa -, teve de incorporar as 
trocas de ameaças, como dispositivo necessário para alcançar o único ponto de equi- 
líbrio da negociação. Ameaças e promessas constituem compromissos ou ações que os 
agentes poderiam dispor para restringirem suas escolhas ou as dos outros no futuro, 
de maneira que não possam mais voltar atrás”. Na visão de Nash, alguém ameaça o 
outro quando o convence de que caso não atue conforme sua exigência, então o amea- 
çador será obrigado a agir no sentido que havia proposto, ainda que isto seja algo que 
o próprio agente não quisesse fazer”. Uma definição para ameaça mais curta dos que 
as cinco regras semânticas que Searle propôs para indicar esta função ilocucional na 
teoria dos atos de fala, a saber: 


1. Uma ameaça deve ser emitida por uma frase, cuja emissão predica um ato fu- 
turo do falante, caso o ouvinte não aja segundo a demanda do falante; 


2. A ameaça deve ser emitida se o ouvinte prefere que o falante não a realize e 
está em condições de fazer o que o falante quer, sabendo este disto; 


3. À ameaça será enunciada se não for óbvio para os agentes que será executada 
no decurso normal dos acontecimentos; 


4. Ao enunciar a ameaça o falante tem realmente a intenção de fazê-la, caso o 


ouvinte não faça o que este quer; 


>. E sua emissão vale como uma obrigação de realização da ação por parte do 
falante, se o ouvinte não agir como ele deseja”. 


De qualquer forma, trata-se da situação que pode ser claramente representada 


na matriz montada por Luce e Raiffa, em Games and Decisions, reproduzida na figura 
2.4. 
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O par (0, 100) mostra o equilíbrio que resulta do encontro das estratégias puras 
dominantes alto e esquerda, respectivamente, para Linha e Coluna. Sem a possibilida- 
de de comunicação e jogado simultaneamente de uma única vez, é previsível que Co- 
luna vá receber 100 e Linha zero. Entretanto, se for permitida a comunicação prévia 
entre os jogadores, Linha terá a oportunidade de impor um acordo a Coluna, ameaçan- 
do jogar “baixo”, ainda que viesse sofrer a perda de -1, caso seu oponente mantivesse a 
posição da “esquerda” e não aceitasse abrir mão dos 100 em seu favor, pelos resultados 
produzidos através das ações “alto-direita”. Do ponto de vista de um agente egoísta, 
esse tipo de comportamento, da parte da Linha seria impensável, posto que qualquer 
perda, ainda que pequena, deve ser evitada pela racionalidade estratégica, presumida. 
Contudo a possibilidade de ameaça está aberta pela via da comunicação e se Coluna 
prefere fazer valer sua expectativa de ganho, deve evitar, de todo modo, entrar em con- 
tato com Linha, mantendo o jogo na categoria não-cooperativa e preservando o curso 
“natural” das coisas. Por sua vez, Linha, caso queira perseguir os 100, deve procurar 
de todas as maneiras levar Coluna à mesa de negociação, onde demonstraria todo seu 
poder de barganha. Neste caso, Coluna poderia contra-atacar ameaçando “direita” se 
Linha jogar “baixo”. Porém, o prejuízo que teria seria maior do que os -40 impostos 
ao primeiro, já que o próprio perderia 100 a mais do que em sua dominante. À ameaça 
de Coluna, portanto, teria pouca credibilidade em relação a da Linha”. 


Para que a comunicação da ameaça surta algum efeito, é preciso que o oponen- 
te não perceba que haja qualquer incentivo da parte de quem ameaça para mentir. 
Desde modo, o grau de credibilidade que o conteúdo desta informação pode alcançar 
depende da coincidência dos interesses dos jogadores em um ponto de equilíbrio viá- 
vel. Mas ainda assim, uma completa previsão do que pode acontecer depende de um 
entendimento detalhado da análise econômica e psicológica dos agentes, posto que 
entra em jogo também a reputação de cada um e sua disposição em preservá-la. À tro- 
ca de ameaças em uma negociação visa promover a dissuasão entre as partes. Nesse 
sentido, agir como uma máquina do juízo final torna-se um recurso muito eficaz em 
situações extremas. Por outro lado, paradoxalmente, cortar as comunicações pode vir 
a ser a melhor atitude de quem tenha vantagem se o jogo for disputado de uma só vez 
na forma não-cooperativa, sem conversações prévias. Além disso, um dos fatores que 
contribuem para reforçar a credibilidade das ações é o custo de realização das ameaças. 
Quanto maiores eles forem e quanto mais abrangentes as suas consequências, maiores 
são as dúvidas de que possam vir a ser desempenhadas, tal como a possibilidade de 
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destruição nuclear, depois da Guerra Fria. Esse detalhe sobre o custo da ameaça para 
o falante permite que a interpretação desse tipo de ato de fala, seja mais abrangente, 
através da Teoria dos Jogos do que apenas pela Filosofia da Linguagem. Pois vai mais 
longe que a visão analítica, semântica, ou até pragmática, comum a essa área da filoso- 
fia, e amplia os estudos da compreensão do comportamento linguístico, incorporando 
os interesses expressos na função de utilidade dos agentes falantes. 


Outro aspecto linguístico importante que pode ser tratado pela teoria dos jogos 
falados diz respeito ao significado que não pode ser entendido apenas por análise de 
conceitos. As mensagens que são empregadas para formação de equilíbrio e precisam 
ser enviadas dependem do conhecimento comum da língua partilhado pelos falantes 
de uma comunidade. Mensagens que sejam consideradas neologismos, inesperadas para 
o contexto em que estão sendo usadas, não permitem que pontos de equilíbrios pos- 
sam ser encontrados, exceto quando seu significado literal é considerado. De tal sorte, 
que a interpretação do significado fornecida por Joseph Farrell corrobora a concepção 
wittgensteiniana de que o uso é uma das principais maneiras de conferir significa- 
do aos termos da língua”. Mesmo que problemas de comunicação possam impedir a 
troca de informações entre os jogadores, prejudicando a compreensão do significado, 
modelos de situações onde se busca a coordenação, mostram que pontos focais podem 
ser descobertos por agentes que partilhem interesses comuns e convivam sob conven- 
ções semelhantes. Seguindo Thomas Schelling, de um modo geral jogos de coordenação 
são aqueles em que situações de negociação tácita podem transformar o conflito de 
interesses na escolha por uma ação coordenada promovida por um consenso em torno 
de um resultado que corresponda à mesma interpretação de algum sinal que sirva de 
foco para o encontro das trajetórias traçadas. Tais pontos focais precisam ser nítidos e 
restringirem os possíveis resultados. Jogos de coordenação podem surgir entre pessoas 
com interesses divergentes, como na divisão meio a meio dos $100 ou podem aparecer 
como “pura coordenação” na matriz da figura 2.5. 


Figura 2.5 
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Embora (9, 9) não ofereça o melhor pagamento entre os pontos de equilíbrio, é o 
único resultado que permite o encontro sem confusão entre os jogadores, na ausência 
de comunicação, pois provê uma dica ou “cola” que orienta as escolhas comuns feitas 
por agentes racionais. Pontos focais, nem sempre fornecem a melhor solução para os 
indivíduos, no sentido estrito da teoria dos jogos, mas são uma indicação de que, em 


98 É no artigo FARRELL, ]. “Meaning and Credibility in Cheap-Talk Games”, 3 5, p. 519 que a aproximação 
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Figura 2.6 - Multiestágios 
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contextos empíricos, sinais e convenções devem ser apreciados para que uma escolha 
recaia em soluções racionais fora de “uma formulação dos jogos puramente matemá- 
tica”. Na coordenação das ações, a comunicação leva ao encontro de um equilíbrio 
mais refinado para os agentes, principalmente quando o ótimo de Pareto está dispo- 
nível. Porém, ainda que uma comunicação direta não seja possível a simples presença 
de um rótulo ou mediador (humano ou máquina) pode ajudar os jogadores a se comu- 
nicarem ou sugerir estratégias que levem aos melhores resultados. Sua atuação fica 
evidenciada, por exemplo, em jogos de multiestágios como o da figura 2.6. A tarefa do 
mediador é de procurar uma ação recomendável para cada jogador, que pode ser uma 
probabilidade, e apresentá-la confidencialmente a cada um. Tais ações são calculadas 
a partir de relatórios fornecidos pelos jogadores, e sua precisão depende da honestida- 
de dos relatos e da obediência às recomendações. 


Conforme a interpretação fornecida por Roger B. Myerson, este jogo de mul- 
tiestágios faz com que o primeiro jogador, a Linha, tenha um momento em que pode 
decidir se escolhe a ação “A”, onde um equilíbrio de Nash aguarda em (2,2), ou “a”, 
arriscando obter (5,1) como um outro ponto de equilíbrio que poderia ser alcançado se 
Coluna fosse para “E” depois de Linha ter jogado “C”. Contudo, apenas um mecanismo 
gerador de probabilidade poderia tornar isto factível, uma vez que o conjunto de infor- 
mação de Coluna não permitiria que este decidisse pela estratégia pura “E”, sabendo 
que poderia ganhar (1,5), seguindo “D”. Se um meio de comunicação pudesse garantir 
que a probabilidade 0,5 seria assinalada para ambos resultados (C, E) e (B, D), então, 
cada um poderia receber a expectativa de ganho de pagamento (3, 3), como uma mis- 
tura dessas duas estratégias. Porém, este novo ponto de equilíbrio só estaria disponível 
se Linha abrisse mão de ir para “A”, estratégia que domina “B”, por lhe fornecer dois 
seguros e não apenas o incerto um. Neste instante, a presença de um mediador facilita- 
lhe as coisas ao recomendar que Linha vá para “a”, a fim de maximizar sua utilidade 
esperada. No segundo estágio, o mediador imparcial faz suas recomendações depois 
de lançar uma moeda, cujos lados estariam vinculados respectivamente às estratégias 
conjuntas (C, E) e (B, D). Sua orientação não será desobedecida enquanto um jogador 


esperar que o outro obedeça às instruções. Tentar fugir unilateralmente dessa situação 
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tem como punição zero de recompensa. Tal exemplo ilustra o modo como a comuni- 
cação em multiestágios, feita em qualquer etapa do jogo extensivo, pode gerar novos 


equilíbrios com a intervenção de um mecanismo de mediação adequado!ºº. 


Sinalização e “Conversa Barata” 


Todas as situações em que a comunicação foi apresentada até agora foram mon- 
tadas de maneira que a troca de mensagens e a transmissão de informações, de um 
modo geral, não representavam nenhum custo para o emissor, falante ou ouvinte. 
Quando isso acontece, significa que o simples fato da conversação ter sido permitida 
não alterou os valores da matriz de pagamentos dos jogadores envolvidos. Uma con- 
versa barata, além do custo zero de implementação, só pode ser compreendida quando 
a comunicação é plena, sem mediadores e sem compromissos vinculantes anteriores. 
Em uma “conversa barata”, os jogadores simplesmente falam, embora nem sempre 
os jogadores confiem na verdade do que é dito ou acreditem na palavra de quem fala. 
Não obstante, ainda que não modifique diretamente os pagamentos, as respostas dos 
ouvintes ao que é dito afetam decisivamente o resultado do jogo. O que significa que 
em determinados cenários a conversação plena pode gerar a confiança e a crença que 
motivem os jogadores à cooperação!º!. 


Desde que Luce e Raiffa criaram a “Batalha dos Sexos”, sabe-se que a presença 
da comunicação proporciona resultados melhores, na fronteira do ótimo de Pareto, aos 
jogadores. O segundo estágio do exemplo fornecido por Myerson é uma variante da 
“batalha” original na sua forma extensiva. Nestes casos, um mecanismo de mediação 
gera a confortável aplicação de suas estratégias mistas. Entretanto, uma autêntica 
conversa barata não lança mão de tais recursos. Se for permitido que um dos jogado- 
res, como a Linha, tenha a primazia de transmitir uma mensagem antes de Coluna 
anunciar sua decisão, a escolha por sua estratégia favorita obrigará o segundo a seguir 
esse programa, sob pena de ambos nada obterem. Para que o jogo de conversa barata, 
também chamado de Jogo Falado!?, tenha efeitos positivos sobre as pretensões dos 
Jogadores de modo simultâneo, é preciso que se constitua uma loteria em que ambos 
troquem mensagens ao sabor da sorte até que uma estratégia coordenada surja em 
primeiro lugar. Assim, uma longa conversa barata soluciona o problema de coordenação 
em jogos onde haja conflitos de interesses, como na Batalha dos Sexos, ao permitir 
que a troca de informações seja feita, durante várias rodadas indeterminadas, até que 
uma opção em equilíbrio surja entre os falantes. No entanto, existem razões para estar 
cético quanto à eficiência dos jogos falados que serão tratadas a seguir. 


Em geral, no jogo falado, as mensagens que estão sendo utilizadas não influem 
nos ganhos dos jogadores, pois seus significados são de conhecimento comum. Os equi- 
líbrios obtidos dependem apenas do conteúdo da informação que está sendo enviada 
e das ações tomadas a partir disso. As mensagens passam a determinar os resultados 
quando a informação é incompleta para os jogadores, isto é, um jogador (o emissor) 
sabe de alguma coisa relevante que o outro (o receptor) desconhece. Assim, a transmis- 
são de sinal eficaz passa a ter importância decisiva nos jogos chamados de sinalização, 
aqueles que na sua descrição canônica correspondem ao jogo simples de duas pessoas, 


100 Tudo isso está em MYERSON, R. B. “Multistage Games with Communication”, $ 2, pp. 325-321. 
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desenrolado em dois estágios, no qual o Emissor (E) detém uma informação privada 
com um tipo de valor (t) que deve ser transmitida por uma mensagem ou sinal (s), tira- 
da do repertório (S), ao Receptor (R). Este, por sua vez, embora desinformado, possui 
crenças, baseadas no conhecimento comum, sobre o tipo da informação de É que será 
transmitida com uma distribuição de probabilidade qualquer (p), em relação ao con- 
junto de tipos possíveis (T). Ao receber o sinal, R escolhe de sua lista de estratégias 
compatíveis (4) a ação (a) mais adequada a ser tomada. Os ganhos de ambos jogadores 
é obtido por uma função que envolve os conjuntos (T, S, 4) para cada um. Ao passo 
que, em uma “conversa barata”, os resultados dos falantes são atingidos pelas funções 
de (T, 4), já que a mensagem não acarreta nenhum custo para ambos. 


Sobre outro aspecto, as mensagens que não são usadas para formar equilíbrios 
são chamadas de neologismos. Apesar de inesperados, os neologismos podem, entre- 
tanto, vir a ter significado e credibilidade, quando o conhecimento comum for rico 
o suficiente para permitir uma compreensão literal do enunciado. Sua credibilidade 
também pode ser resgatada em situações em que as mensagens são autossinalizantes, 
quando E deseja que R acredite que o sinal corresponde precisamente a t, sabendo que 
isso só será possível se a mensagem for verdadeira. Nesses casos, R poderia dar crédito 
ao neologismo, interpretando subjetivamente, com razoável probabilidade, que sua 


crença na verdade de t é correta!º. 


Um exemplo típico de sinalização ocorre nas vendas, em geral, onde o vendedor 
(E) de carros ou imóveis procura levar o consumidor (R) a se decidir pela compra do 
produto ou serviço. O produto pode estar em perfeito estado ou conter algum vício 
oculto (T) e o vendedor sabe qual é o seu verdadeiro tipo. Na dúvida, o comprador 
atribui uma certa probabilidade (p) para o estado do objeto. Sem ter como apresentar 
diretamente a qualidade do produto, o vendedor deve oferecer uma garantia que será 
transmitida por um sinal. O comprador decide, com base nesta mensagem, por pagar 
um preço que varia de acordo com a amplitude da garantia (4). Algumas variações 
desta situação admitem mais de um comprador ou ainda ofertas do tipo pegar ou lar- 
gar, quando o vendedor junto com a garantia estipula um preço fixo para venda, de- 


monstrando que tem pleno domínio da negociação!", 


Esses são os principais conceitos empregados na Teoria dos Jogos na hora de 
analisar os modelos de situações em que a comunicação exerce a sua influência. Muitos 
outros surgem para explicar os detalhes eventuais ao longo da investigação. A seguir, 
ver-se-á como eles podem ser mobilizados nos modelos que já se tornaram clássicos, 
enquanto a comunicação transformar jogos não-cooperativos em cooperativos, e vice- 
versa, desmanchando os limites tradicionais e apresentado os jogos falados como uma 
nova categoria, com suas complexidades e dificuldades próprias. 


$5.Jogos com Comunicação e seus Modelos 


Até o início dos anos 1980, ainda não havia sido feita uma formalização que per- 
mitisse a teóricos dos jogos tratar formalmente modelos de jogos com palavras, gestos 
e sua eventual ambiguidade. Teóricos talentosos, como Shubik, viam dois problemas 
de difícil resolução a serem enfrentados na modelagem dos jogos falados. O primeiro 
103 Veja FARRELL, J. Op. cit, 88 2 a 6, pp. 516-52]. 
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referia-se à codificação das palavras e o segundo à descrição do grau de compromisso 
assumido pelos falantes! Desde Von Neumann e Morgenstern, que se imaginava ser 
a forma extensiva a melhor maneira de incorporar a comunicação como parte das 
estratégias disponíveis. Entretanto, as situações onde a possibilidade de comunicação 
fosse muito ampla colocavam enormes complicações formais. Roger Myerson explica 
que a simples comunicação de uma palavra entre dois jogadores obrigaria ao ouvinte 
ter como conjunto de informação nada mais, nada menos do que todos os verbetes de 


um dicionário da mesma língua do falante! 


« Tudo isso porque, em teoria dos jogos, 
os modelos são construídos ostensivamente para atender casos gerais sem privilegiar 
a realização de um evento particular. Ao invés de proceder como o princípio geral de 
Jogos extensivos, talvez fosse melhor considerar que as chances de comunicação estão 


de fato implícitas nas estratégias explícitas dos modelos de jogos. 


Myerson propôs então que jogos com comunicação fossem definidos como aqueles 
em que, além das opções de estratégias descritas especificamente na estrutura do jogo, 
fossem adicionadas uma ampla faixa de opções tácitas para comunicação entre os jo- 
gadores. Para tanto, bastaria que os agentes fossem capazes apenas de falar, sem que 
se precisasse assumir que eles tenham qualquer habilidade para firmar contratos!”. A 
comunicação implícita, ou tácita, foi tratada intuitivamente por Schelling em sua aná- 
lise dos jogos de coordenação, onde é possível encontrar pontos focais que representem 
uma solução para as circunstâncias em que a comunicação direta não é possível nem 
desejável por uma das partes. Isto foi em 1960, a partir da edição do clássico The Stra- 
tegic of Conflict. Entretanto, a modelagem da comunicação pouco avançou no período 
entre este lançamento e as observações de Shubik, até que Vincent Paul Crawford e 
Joel Sobel dessem um segundo passo na formalização de modelos de jogos com emissor 
e receptor!'*. 


No jogo de emissor e receptor entre dois participantes, o emissor possui uma 
informação privada, mas depende da escolha de uma ação por um receptor desinfor- 
mado. Então o emissor envia um sinal ao receptor, que, por ser sujeito a ruído, exige 
uma interpretação estimada de seu significado a partir da qual será tomada a decisão 
sobre uma ação a seguir. 


(...) Cada agente responde otimamente à escolha estratégica 
de seu oponente, levando em consideração as implicações à luz 
de suas crenças probabilísticas e maximizando a expectativa 
de utilidade sobre suas possíveis escolhas estratégicas (CRAW- 
FORD, V. P & SOBEL, J. “Strategic Information Transmis- 
sion”, sec. 2, p. 1433). 


Uma instância desse tipo de situação é apresentada na figura 2.7 montada por Joseph 
Farrel e Matthew Rabin!””, 


105 Veja SHUBIK, M. Teoría de Juegos en las Ciencias Sociales, IX, 94.2, p. 284. 

106 Veja MYERSON, R. “Communication, correlated equilibria and Incentiva Compatibility”, in AUMANN, 
R. J. & HART, S. Handbook of Game Theory, vol.2, cap. 24, p.828. Imagine-se na condição de turista em um país do qual 
não conhece 0 idioma, a procura de uma palavra no seu dicionário de bolso, para traduzir o que um nativo lhe dissera há pouco! 
107 Veja MYERSON, R. Op. cit., idem. 

108 Veja CRAWFORD, V. P. & SOBEL, ]. “Strategic Information Transmission”, in Econometrica, vol 50, nº 6, 
pp. 1431-1451. 

109 Veja FARRELL, ]. & RABIN, M. “Cheap Talk”, p. 106. 








Dois pontos de equilíbrio são encontrados quando os pares de estratégias puras 
(alto, esquerda) e (baixo, direita) acontecem. Para Linha, seria melhor que Coluna 
esquecesse sua mão direita em casa e escolhesse esquerda. Entretanto, Coluna sabe 
que baixo domina fracamente alto e caso essa dominante venha ser a escolha efetiva 
de Linha o melhor que faria seria escolher direita. Só Linha sabe quais são suas reais 
intenções, mas para influir na escolha de Coluna, envia-lhe uma mensagem dizendo 
que vai jogar “alto”. Cabe agora à Coluna decidir se vai para esquerda ou para direita. 
Se acreditar na informação e decidir pela Esquerda, corre o risco de se decepcionar 
quando receber zero, depois que Linha for para Baixo, optando por ganhar ao menos 
um, caso Coluna vá para Direita. 


Figura 2.7 - Significado sem Crédito 
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A falta de um sinal que seja evidente por si mesmo, quer dizer, o tipo de estado 
que Linha pretende informar a Coluna pode não ser o mesmo que ela realmente está, 
faz com que a transmissão da informação feita sem custo, nestas circunstâncias, não 
tenha nenhuma credibilidade. Para enfatizar sua mensagem teria o emissor de fornecer 
alguma garantia que lhe fosse custosa, a fim de que os custos pelo não cumprimento da 
promessa compensassem os riscos do receptor em acreditar na palavra do falante. Caso 
contrário, tudo o que o primeiro jogador disse poderia até ter significado, mas nenhum 
crédito para o tomador de decisão. Tal estrutura subjaz a contextos da vida cotidiana 
como a busca por emprego em uma firma. O candidato à vaga pode querer ocupar um 
cargo que pague mais, mas que exija alta capacidade, embora saiba que possui habi- 
lidade baixa. Sem ter como verificar prontamente a que tipo pertence o candidato a 
empresa se vê obrigada a destiná-lo a um cargo inferior. Assim como preveem Farrell 


e Rabin no artigo “Cheap Talk”. 


Uma rodada prévia de conversa barata em nada ajudaria a uma pessoa nessas 
circunstâncias. Quem recebe a informação tem motivos para desconfiar de sua vera- 
cidade. Tudo por causa de uma distribuição de valores desfavorável à apreciação da 
verdadeira condição do falante. Essas situações são aquelas em que há margem para 
mentira, uma vez que o emissor teria mais a ganhar ocultando seu tipo real. Ocupar 
um alto cargo com uma capacidade não correspondente lhe traria um maior ganho do 
que se houvesse uma paridade na correlação entre o tipo e o sinal transmitido. Pense 
nos custos de adquirir uma alta capacidade de desempenho. 


Contudo, quando a distribuição dos ganhos na matriz é diferente, como na figura 
2.3, já não há incentivo nem qualquer vantagem para o falante informar algo que não 
corresponda ao que é de conhecimento privado. 


10 Veja FARRELL, J. & RABIN, M. Op. cit. pp. 105-107. 
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Figura 2.8 - Significado e Crédito 
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Agora, se Linha informar que vai para o Alto, não resta a Coluna outra opção a 
não ser acreditar na mensagem e ir para a esquerda, e vice-versa. A “conversa barata” 
pode então exercer plenamente a função de transmitir um sinal sobre o tipo real do 
agente. As escolhas das estratégias são então facilmente coordenadas. É o mesmo qua- 
dro visto no modelo tradicional da Batalha dos Sexos, com a solução correspondendo 
a um dos dois pontos de equilíbrios puros existentes. 


Comunicação e Interesses 


No jogo de emissor e receptor apenas uma rodada prévia de comunicação é per- 
mitida e o sinal segue uma única direção, sem possibilidade de retroalimentação. Em 
uma conversa mais prolongada a simetria dos papéis, de um modo geral, e na Batalha 
dos Sexos, mais especificamente, poderia servir para esclarecer confusões ou ruídos 
que possam ocorrer desde a primeira transmissão, quando se busca coordenar as ações. 
Entretanto se os interesses divergentes podem geram conflitos, os ganhos potenciais 
podem desaparecer na discussão sobre o que se deve cooperar. Na ausência de um me- 
canismo de controle da comunicação, o encontro de um ponto focal pode ser a melhor 
alternativa a uma conversa barata. 

A comunicação direta desempenha um papel importante, na medida em que os 
fins dos agentes tenham um relacionamento mais próximo. A perfeição da comunicação 
depende completamente da coincidência dos interesses dos participantes, como 
sugerem Crawford e Sobel, na conclusão de seu artigo!!!. A comparação entre os efeitos 
do ponto focal, ou convenção, e os de uma conversa barata ilustram essa questão. Linha e 
Coluna resolvem fazer as pazes e marcar um jantar. Têm quatro opções possíveis, sendo 
indiferentes às três primeiras que são preferidas em relação à quarta - um restaurante 
ruim, mas próximo dos jogadores. Suas recompensas são expressas na figura 2.9. 


Figura 2.9 - "Pura Coordenação” 
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ll Veja CRAWFORD, V. P. & SOBEL, J. Op. cit. vol 50, nº 6, pp. 1450. 
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O par em equilíbrio formado pelo encontro das estratégias que levam ao 
Restaurante Quatro é o menos eficiente, muito longe do ótimo de Pareto. Entretanto, 


esse será o ponto focal que atrairá as partes caso não seja possívelnenhuma comunicação 
direta. Se ao menos um único sinal pudesse ser transmitido ao outro, todos fariam o 
esforço de comunicá-lo e interpretá-lo da maneira mais evidente possível, marcando 
o encontro em um dos três primeiros restaurantes. O pior dos mundos seria alguém 
achar que seu sinal fora corretamente compreendido, enquanto o outro ignorando o 
tipo verdadeiro se encaminha para o Restaurante Quatro. Para evitar tal confusão, a 
retroalimentação se faz necessária, ou uma conversa um pouco mais estendida capaz 
de evitar qualquer dúvida ou mal-entendido, com respeito ao destino de ambos. Em 
todo caso, esse exemplo de pura coordenação esclarece a força da comunicação direta 
frente ao ponto focal quando se trata de otimizar os resultados". 


Situações de pura coordenação, como essas, facilmente permitem encontrar uma 
solução que seja autossinalizante e autocompromitente. O que ocorre quando Linha, por 
exemplo, afirma que irá ao Restaurante Três. Essa sinalização se mostra digna de cre- 
dibilidade para Coluna, uma vez que Linha só expressaria essa vontade de ir a Três se, 
de fato, quisesse ir lá - seu tipo será, então, evidente por si mesmo. Além disso, Linha 
tem incentivo para realmente realizar a sua vontade expressa, pois obterá na resposta 
adequada de Coluna o maior ganho disponível. Acompanhando Farrell e Rabin, “uma 
mensagem que é ao mesmo tempo autossinalizante e autocompromitente, parece al- 
tamente crível, (...) não há problemas para que faça sentido”"?. Do ponto de vista da 
teoria dos jogos, significado, credibilidade e compromissos surgem do interesse pessoal 
de cada um em realizar uma ação que corresponda àquilo que foi dito, como sua ver- 
dadeira intenção. De outro modo, uma coordenação que não envolva compromissos 
ou contratos explícitos, sem comunicação direta, só é possível encontrar uma solução 
equitativa quando pontos focais ou convenções estão disponíveis. Contudo, nem sem- 
pre essa solução é a mais eficaz, como mostra a matriz dos quatro restaurantes. 


Por outro lado, a aplicação da comunicação direta a modelos onde os interesses 
não estão plenamente alinhados, ou estão em conflito iminente, como o Dilema dos 
Prisioneiros, se torna ineficaz quando o jogo é de uma só rodada e simultâneo. De 
nada adianta um dos prisioneiros prometer ficar calado se o outro também ficar, pois 
sua estratégia estritamente dominante está na deserção. Apenas quando rodadas su- 
cessivas do Dilema dos Prisioneiros são permitidas é que a comunicação poderia servir 
para alinhar os interesses divergentes em torno da cooperação mútua, mas isso envolve 
outros fatores típicos da iteração do jogo que serão abordados na próxima unidade. 
No Dilema dos Prisioneiros, a comunicação pode ajudar a emergir a cooperação, sem 
a necessidade de firmar acordos, apenas pela implementação de ações de reciprocidade. 


Sistemas de Comunicação 


À transmissão de informação, eventualmente, pode ser realizada por meio de um 
sistema de comunicação que sirva de canal de ligação entre emissor e receptor. Quando 
a mensagem é emitida por via direta os relatos são trocados pelos próprios jogadores, 
sem o risco de distorção. Entretanto, a presença de ruído obriga a consideração da 
probabilidade da mensagem chegar corretamente a seu destino. O cálculo da proba- 


llz O exemplo do Restaurante foi apresentado e analisado por FARRELL, J. & RABIN, M. Idem, pp. 110-112. 
13  FARRELL, J. & RABIN, M. Ibidem, p. 112. 








bilidade também ocorre sempre que houver a intervenção de uma mediação que faça 
uso de mecanismos aleatórios para recomendação de uma ação como no exemplo de 
mediação de jogos de multiestágios descrito antes. 


Um sistema de comunicação abrange de um modo geral todos os modos de comu- 
nicação, sendo a transmissão direta, sem ruído ou mediação, um caso particular desta 
classificação. O recurso a um mediador permite que os jogadores possam partilhar 
uma informação entre eles. Esse mecanismo é empregado a fim de permitir a melhoria 
na expectativa de ganhos maiores. O que não poderia ser alcançado de outra forma. 


Nessa matriz (Figura 2.10) - adaptada de Roger Myerson -, sem comunicação 
existem apenas dois pontos de equilíbrio no encontro das estratégias puras (alto, es- 
querda) e (baixo, direita) que conferem, respectivamente, (5, 1) e (1,5). A mistura das 
estratégias proporciona um terceiro equilíbrio com ganhos (2.5, 2.5). Para atingir o 
resultado equitativo (4, 4), seria necessário o estabelecimento de um contrato vinculante 
entre as partes, já que ele não está em equilíbrio". Ao recorrer a um mediador, ambos 
Jogadores poderiam esperar obter um resultado autoaplicável (self-enforcing), sem pre- 
cisar apelar para um acordo que os amarrassem, como um contrato. Bastaria apenas 
que seguissem a recomendação do mediador de adotar as estratégias conjuntas (alto, 
esquerda), (baixo, esquerda) e (baixo, direita) 1/3 das vezes. Seguindo esta orientação, 
cada um teria a expectativa de resultado equivalente a (3 1/3, 3 1/3), superior à estra- 
tégia mista. Para isto o mediador deve informar apenas parcialmente a cada jogador 
qual estratégia ele tem de seguir, sem revelar como o outro fora instruído. Procedendo 
assim, os jogadores não teriam alternativa senão obedecer suas recomendações, que 
passam a ser autoaplicáveis. Do contrário, se a estratégia recomendada pelo mediador 
fosse de conhecimento comum, um poderia explorar a submissão do outro, trocando 
a estratégia recomendada por outra que a dominasse recaindo na situação do jogo 
original. Nesse sentido, o mediador atua também como um tipo de instrumento que 
limita a transmissão de informação a uma quantidade que seja a mais adequada para 
as partes, dada as circunstâncias. 


Figura 2.10 
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Robert John Aumann e Sergiu Hart descreveram um outro tipo de mecanismo 
que torna rodadas sucessivas de conversação prévia - longas conversas baratas - capaz 
de melhorar o desempenho dos falantes. A padronização oferecida por eles para os 
Jogos Falados é composta por três fases: na fase de informação, um jogador possui uma 
informação privada que deverá ser transmitida aos outros; na fase de conversação, os 
Jogadores têm um número de rodadas indeterminadas em que as mensagens são troca- 
das simultaneamente entre os jogadores; por fim, na fase de ação, decidem também ao 


ll4 Veja MYERSON, R. Op. cit., idem. 





mesmo tempo qual estratégia executarão!”, 


Posto desta maneira, o procedimento de uma conversação sem custo pode ser 
simulado em um computador com um teclado cujas letras ou comandos representam 
sentenças, fórmulas ou instruções contidas em uma “macro”, ou simplesmente “a” ou 
“b”. Em cada estágio de fala os jogadores enviam suas mensagens contendo as estra- 
tégias que pretendem adotar na fase da ação. Ao trocarem suas mensagens ao mesmo 
tempo, os jogadores reproduzem um dispositivo de loteria conjunta controlada que, na 
concepção de Aumann e Hart, é fundamental para construção de compromissos entre 
as partes. As rodadas consecutivas de troca de mensagens simultâneas restringem o 
compromisso dos agentes ao primeiro par de estratégias idênticas comunicado. Ao 
atingir tal equilíbrio, nenhum dos falantes teria motivos para abandonar a escolha 
conjunta, sem uma consequente perda ocasionada pelo desvio, com ganhos abaixo do 


valor oferecido pela loteria conjunta". 


Diversos outros aspectos da comunicação e sua dinâmica foram desenvolvidos 
por teóricos dos jogos interessados no assunto e não é possível esgotar toda a ques- 
tão nesta apresentação sumária. Limitações e soluções para diversos impasses que 
existiam antes dos jogos falados serem formalizados foram descobertas, enquanto no 
campo filosófico uma outra concepção do papel da comunicação na deliberação dos 
agentes racionais era adotada por pesquisadores ligados à teoria crítica da Escola de 
Frankfurt. Na sequência deste capítulo, os pontos comuns e divergentes a ambas te- 
orias serão abordados, a fim de observar as contribuições que são oferecidas para o 
esclarecimento dos efeitos da comunicação sobre a busca de soluções cooperativas con- 
sistentes com uma concepção plausível de indivíduos que pretendem satisfazer seus 
interesses pessoais. 


$6.A Razão Comunicativa x Estratégica 


Entre os filósofos, sobretudo aqueles ligados à teoria crítica da Escola de Frank- 
furt e os interessados na obra de Max Weber (1864-1920), é comum distinguir-se ra- 
zão instrumental ou estratégica de outras formas de racionalidade. Isso não chega a 
ser uma inovação frankfurtiana. Na tradição moderna, outros autores como Thomas 
Hobbes e Immanuel Kant (1724-1804) já destacavam a razão calculadora, a hipoté- 
tica, a pura ou a prática!””, Trata-se, de fato, de variações do modo pelo qual a mente 
humana procura resolver problemas metafísicos ou epistemológicos (razão pura), éti- 
cos (prática) e teleológicos (instrumental ou estratégica). Há ainda uma racionalização 
da linguagem (razão comunicativa) que visa encontrar um entendimento mútuo sobre 
aquilo que está sendo enunciado. Esse tipo de racionalidade foi defendido inicialmente 
por Habermas em vários textos desde “Técnica e Ciência como Ideologia”, de 1968. 


A teoria dos jogos privilegia análises sobre as escolhas racionais das estratégias 
mais adequadas à realização de uma ação que atinja os fins almejados. Nesse sentido, 
o modelo de jogos enquadra-se em parte na definição de trabalho ou racionalidade 
teleológica feita por Habermas, em meados do século XX. 


(...) A ação instrumental orienta-se por regras que se apoiam 
no saber empírico. Essas regras implicam em cada caso prog- 


15 Veja AUMANN, R. & HART, S. “Long Cheap Talk”, 9 3. p. 12. 
16 Veja AUMANN, R. & HART, S. Op. cit. $ 3. pp. 13-14. 
Wi Veja HOBBES, Th. Leviatã, I part. cap. Y, p. 21 e KANT, I. Crítica da Razão Prática, prefácio, A3, p. ll. 








noses sobre eventos observáveis, físicos ou sociais. (...) O com- 


portamento da escolha racional orienta-se por estratégias que 
se baseiam num saber analítico. (...) A ação racional teleológi- 
ca realiza fins definidos sob condições dadas; mas, enquanto a 
ação instrumental organiza meios que são adequados ou inade- 
quados segundo critérios de controle eficiente da realidade, a 
ação estratégica depende apenas de uma valoração correta de 
possíveis alternativas de comportamento, que só pode obter-se 


de uma dedução feita com o auxílio de valores e máximas (HA- 
BERMAS, J. Técnica e Ciência como Ideologia, III, p. 57). 


Na concepção de Habermas, são apontados aspectos axiológicos que os teóri- 
cos dos jogos não assumem explicitamente, mas que estão ligados à maneira como os 
agentes listam suas preferências em utilidades. Não obstante essas sutilezas, guarda 
a teoria dos jogos uma estreita vinculação com a racionalidade teleológica, cuja ação 
correspondente é orientada para a realização de determinados fins. Além disso, essa 
teoria traz também elementos de interação, na maioria dos modelos de jogos, que se 
aproximam da racionalidade comunicativa elaborada por Habermas, quando se tem 
em vista os jogos com comunicação, por exemplo. 


(...) [Entendo por ação comunicativa uma interação simbólica 
mediada. Ela orienta-se segundo normas de vigência obrigató- 
ria que definem as expectativas recíprocas de comportamento 
e que têm de ser entendidas e reconhecidas, pelo menos, por 
dois sujeitos agentes. As normas sociais são reforçadas por san- 
ções. O seu sentido objetiva-se na comunicação linguística quo- 
tidiana. Enquanto a realidade das regras e estratégias técnicas 
depende da validade de enunciados empiricamente verdadeiros 
ou analiticamente corretos, a validade das normas sociais só se 
funda na intersubjetividade do acordo acerca de intenções e só 
é assegurada pelo conhecimento geral das obrigações (...) (HA- 


BERMAS, J. Op. cit., III, p. 57/8). 


Já aparecem nessas primeiras definições de razão comunicativa algumas diver- 
gências que afastam a realidade estratégica dos jogos da vinculação estrita com a ins- 
trumentalidade que contrasta com a ação comunicativa. Isso porque, embora seus 
enunciados possam ser interpretados de forma analítica - como na filosofia da lingua- 
gem, dotadas de valores de verdade ou falsidade -, as diversas estratégicas disponíveis 
aos agentes contam como sendo factíveis, passíveis de serem realizadas e, nesse sentido, 
todas são empiricamente verdadeiras. Por outro lado, a formulação matemática que 
é feita para análise de uma determinada situação não está livre de contextualização, 
uma vez que procuram descrever como se deve escolher as melhores estratégias, levan- 
do-se em conta os fatores determinantes das circunstâncias simplificadas nos modelos 
de jogos. Por isso, fazem tais descrições uma simulação hipotética do desempenho dos 
agentes, conforme as condições iniciais relevantes para interpretação da interação. 


Ademais, a teoria dos jogos procura delinear as condições estruturantes de uma 
interação em seu nível mais básico. Para usar uma metáfora da linguagem dos com- 
putadores, a teoria dos jogos trabalha na “interface de máquina” dos dados e opera- 


ções manipulados por “unidades de processamento”, no intuito de extrair a solução 








logicamente inferida das proposições apresentadas. O “código fonte” dos programas 
executados em ambientes diferentes pelos diversos agentes. Sua “interface humana” 


são as narrativas, contos e histórias criadas pelas pessoas: o “dilema dos prisioneiros”, 
a “batalha dos sexos”, o “bem público”, ou o “ultimato” que nada mais são do que 
parábolas para jogos montados em matrizes, árvores e fórmulas matemáticas. 


Ao perceber-se a teoria dos jogos dessa perspectiva formal - como instrumento de 
análise de interações -, não só a ação teleológica pode ser melhor compreendida, mas 
também a razão comunicativa tem reveladas suas limitações de aplicação, permitindo, 
assim que se proceda a uma crítica da razão comunicativa que resta por fazer. Os mo- 
delos de jogos com comunicação proporcionam uma excelente ferramenta de avaliação 
da eficácia da comunicação ao realizar seus fins, sejam emancipatórios ou de domina- 
ção. Desse modo, é possível compreender como a presença ou ausência de elementos 
específicos podem facilitar a coordenação das ações - fomentando a cooperação - ou 
apenas permitir que ameaças ocorram no sentido de impor determinada linha de ação 
em detrimento de outra. 


Em todo caso, os exemplos mostrados antes servem para indicar que a comu- 
nicação, embora seja um fator importante do relacionamento entre seres vivos, tem 
um campo de atuação restrito pelo modo como a interação é montada. Nos jogos de 
soma zero e informação perfeita, é dispensável. Nos de soma variante, tem um uso 
problemático quando a matriz induz o recurso de ameaças e promessas. Não obstan- 
te, mesmo que tais circunstâncias dificultem o uso pleno da comunicação - segundo 
seus pressupostos pragmáticos idealizantes"º -, elas decorrem da concepção egoísta 
dos agentes racionais adotada pela teoria. 


Esse tipo de objeção pode ser facilmente contornada quando se compreende os 
sujeitos deliberantes como entes que possuem apenas os elementos constitutivos míni- 
mos e necessários para uma tomada de decisão: a motivação que se resume a crenças e 
desejos que compõem seus interesses pessoais. Todas as outras formas de racionalidade 
podem ser descartadas de um agente racional, menos a sua razão teleológica. Sem esta, 
simplesmente não haveria atuação passível de ser motivada. Posto que faltariam os 
itens indispensáveis para relação entre princípios e fins". Por deixar de fora do dis- 
curso argumentado todos valores moldados pelo convívio social, a Ética do Discurso 
- para citar um exemplo de teoria que eliminou a motivação da deliberação - tornou-se 
uma proposta cuja aplicação é inviável nos contextos concretos do dia a dia, onde a 
comunicação se exerce em função de provocar não só o entendimento mútuo, mas um 
efeito no ouvinte que o leve a agir em consequência do que foi dito - o chamado efeito 


perlocucionário da fala!?. 


118 Desde HABERMAS, ]. “Notas Programáticas para a Fundamentação de uma Ética do Discurso”, in 
Consciência Moral e Agir Comunicativo os pressupostos pragmáticos de uma situação ideal de fala passaram por 
várias reformulações até chegarem a forma condensada de HABERMAS, J. “Racionalidade do Entendimento Mútuo”, 
in Verdade e Justificação. 

119 Em DAMÁSIO, À. O Erro de Descartes são apresentados exemplos dramáticos da necessidade de motivação para que 
as escolhas por ações sejam adequadamente feitas. 

120 Em tempo, no artigo HABERMAS, J. “Racionalidade do Entendimento Mútuo”, in Verdade e Justificação, 
o autor tentou fazer uma nova distinção entre os tipos de racionalidade, mas sua descrição imprecisa das condições em que uma 
ameaça ou um ato perlocucionário podem ser eficazes demonstram que ainda ignora o uso da teoria dos jogos nas análises dos 
jogos de comunicação. 





Estratégia e Dominação 


A razão instrumental foi classificada como uma faculdade que seleciona os meios 
adequados para alcançar determinado fim, orientada por regras empíricas de “contro- 
le eficiente da realidade””. Esse aspecto dominador da razão teleológica (estratégica 
e instrumental) constitui o principal empecilho para consideração da competência es- 
tratégica no confronto da vontade contra a influência das inclinações representadas 
pelos interesses particulares de um indivíduo ou pelos bens privilegiados de uma cul- 
tura específica. Só o agir comunicativo atuante numa relação mediada pela linguagem, 
seria capaz de orientar os agentes conforme “normas de vigência obrigatória” inter- 
nalizadas e admitidas intersubjetivamente. Ao invés de tentar ampliar o poder tecno- 
lógico de um determinado grupo ou indivíduo, a linguagem proporcionaria a reflexão 
necessária em torno do interesse emancipatório da espécie humana"?, 


Os dois tipos de racionalidade — o dirigido a fins (instrumental e estratégico) e o 
de uma comunicação livre de coerção — disputariam o fornecimento de soluções para 
as questões teóricas e práticas. Entretanto, só quando a razão teleológica declinasse da 
substituição e restrição da linguagem, durante a formação da vontade, é que o poten- 
cial de libertação poderia se constituir de vez. Livre de qualquer limitação e ameaça, a 
discussão pública avançaria em direção a um consenso, contribuindo para o desenvol- 
vimento da autonomia dos indivíduos!?. 


O prevalecimento do agir estratégico, na tradição da teoria crítica, reproduz 
a dominação ideológica da tecnologia sobre a sociedade e a natureza. Sua função é 
simplesmente privilegiar os interesses restritos de quem detém o poder, a despeito de 
interesses mais abrangentes. A competência estratégica representaria, portanto, um 
obstáculo quase intransponível ao projeto emancipatório da modernidade. Mas este 
não é o único problema inerente na ação voltada para o sucesso de determinados fins. 
A Teoria dos Jogos também detectou uma série de limitações dessa forma de pensar as 
soluções nos problemas da escolha. 


Por prestar atenção apenas na satisfação de seus interesses, muitos são levados a 
resultados paradoxais desastrosos, quando prevalece uma postura paramétrica — agir 
como se fosse o único centro de deliberação e o resto ficasse inalterado frente as ações 
executadas. O choque de interesses, em consequência, tornaria impossível encontrar 
um ponto de equilíbrio, a não ser por acaso. Mas ainda que se admitisse uma prová- 
vel reação contrária às ações implementadas, a existência de mais de uma opção em 
equilíbrio geraria embaraços ao agir estratégico, como demonstram jogos do tipo do 
Dilema dos Prisioneiros e a Batalha dos Sexos. Isto porque, ao escolher a estratégia 
maximizadora de sua utilidade esperada, os agentes racionais cairiam em resultados, 
cuja dominância fornece ganhos abaixo do que é considerado ótimo. 


Explicações iniciais sugerem que a simplificação dos cálculos induziria agentes 
racionais à adoção equivocada da posição paramétrica, que facilita a abordagem cog- 
nitiva dos detalhes da barganha pelas partes envolvidas. Noutras situações, a ausência 
de instrumentos adequados, como a comunicação, impediria o acesso a ações conjun- 
tas que conduzissem aos melhores resultados. A incerteza e a indeterminação sobre 


l21 Veja HABERMAS, J. “Técnica e Ciência como Ideologia”, seç. III, p.51. 
122 Veja HABERMAS, J. Op.cit., seç. III, pp. 51 a 60; seç.VI, p. 15 e VII, p.82. 
123 Veja HABERMAS, ]. Idem, seç. VIII, p.88. 








os desdobramentos futuros seriam fatores cruciais para limitação do sucesso do agir 


estratégico. 


A incerteza aparece em jogos de soma variável — diferente de zero — e nos de soma 
zero com informação imperfeita, nos quais um ou mais lances são executados pela 
natureza. Nessas ocasiões, a probabilidade de uma ocorrência influencia a tomada de 
decisão, impedindo que uma estratégia estritamente determinante seja encontrada. 
Somente o emprego de cálculo probabilístico permite a projeção de estratégias mis- 
tas, onde os sorteios são preferidos de acordo com a maior chance de um resultado 
vir acontecer. Isso, no entanto, aumenta as dificuldades de uma clara percepção do 
porvir, perturbando o comportamento racional dos participantes. Encontrar uma so- 
lução que represente uma imputação de resultados racionais esperados a cada parte, 
passa a depender da sorte e da disposição dos agentes em aceitar os riscos acarretados 
pelas decisões assumidas em tais circunstâncias. A princípio, seres racionais são, por 
definição, aqueles que seguem as soluções encontradas que lhes garantam o resultado 
ótimo. Mas, quando as soluções ficam ao sabor do acaso, tal conduta fica prejudicada. 


Em outras palavras, assumindo-se que ser racional é produzir os melhores re- 
sultados para o indivíduo, uma racionalidade instrumental mínima exigida deve ser 
aquela que, além de projetar as linhas de ação que maximizam a utilidade esperada, 
deve também poder prever o comportamento consequente mesmo em situações em 
que elementos irracionais estejam envolvidos. Na última década do século XX, o refi- 
namento da descrição de jogos estudados revelou a riqueza de soluções que podem ser 
geradas quando pequenas modificações são feitas nos modelos padrões, seja pela re- 
petição sucessiva de diversas rodadas, seja pela permissão de troca de informações, ou 
ainda pela mudança do enquadramento da situação. A linha de pesquisa que avalia o 
papel da comunicação e do conhecimento comum dos participantes — uma abordagem 
paralela ao agir comunicativo da teoria crítica — já permite uma comparação entre os 
pontos coincidentes que antes eram apresentados com uma aparente divergência, logo 
desfeita quando se nota sua compatibilidade. 


Mais Conversa 


À comunicação não se reduz aos aspectos estruturais de uma sintaxe e semânti- 
ca linguística, nem só ao âmbito exclusivo de uma pragmática da linguagem, voltada 
para o entendimento. Para ser compreendida como um fenômeno natural em sua to- 
talidade, é preciso levar em conta seus efeitos perlocucionários e as modificações que 
a ação comunicativa, de um modo geral, provoca nos seres vivos e, por conseguinte, 
no mundo. À eficácia da comunicação não se restringe a uma competência linguística, 
sendo como sua forma implícita ou explícita pode exercer a coordenação das ações dos 
agentes envolvidos numa interação, sem que sua função instrumental seja considera- 
da. O Dilema dos Prisioneiros só é um dilema porque a comunicação entre eles está 
proibida. A Batalha dos Sexos também é um problema só para os “casais” que não 
têm como falar entre si antes de decidir o que fazer. Nada que uma boa conversa não 
pudesse revolver. 


Pontos focais, “telepatia”, comunicação tácita são alguns nomes, cujo significa- 
do se reduz à formação de um repertório de símbolos constituídos por uma comuni- 


dade através de um convívio social e cultural partilhado por um grupo de pessoas ao 








qual pertençam os jogadores, em uma palavra: convenções. À função exercida por tais 


mecanismos tem por objetivo fomentar o entendimento acerca das estratégias relevan- 
tes, para então, possibilitar a seleção daquela que maximize a utilidade esperada. Ao 
revelar essa forma de comunicação subjacente a contextos de aparente isolamento, a 
Teoria dos Jogos ajudou a esclarecer o modo pelo qual comunicação e razão estratégia 
podem atuar de maneira complementar. Fatores comunicativos pertinentes ao jogo de 
interação social, que não estão explicitamente postos, induzem a escolha das estraté- 
gias puras disponíveis que melhor atendam aos interesses de todos. O isolamento inibe 
o recurso a ameaças que poderiam distorcer os resultados em favor de um agente com 
posição privilegiada sobre o outro. Imunes à coerção ou controle externo, resta aos 
Jogadores agir pela estratégia conjunta observável com o melhor resultado factível. 


Entretanto, a comunicação implícita muitas vezes impede o acesso a um equi- 
líbrio na fronteira do ótimo de Pareto (eficiência) — aquela onde estão as estratégias 
conjuntas nas quais ninguém pode obter mais sem diminuir o ganho do outro. Uma 
troca de informação explícita conhecida pela expressão “conversa barata” (cheap talk), 
quando permitida antes do início do jogo, tem-se revelado como o meio mais eficiente, 
senão um dos mais, para atingir equilíbrios ótimos de Pareto ou de Nash. Estudos de- 
senvolvidos a partir dos anos 1980 revelaram a tendência para escolha de estratégias 
cooperadoras, sempre que se abre uma ou mais rodadas de comunicação antes da fase 


de ação do jogo iniciar", 


Uma longa conversa barata pode transformar situações de aparente conflito em 
pura coordenação, como mostra o exemplo da Batalha dos Sexos. Outros contextos, 
entretanto, exigem que algo mais seja dito. O Dilema dos Prisioneiros possui uma 
matriz cuja configuração traz maiores dificuldades. O significado e a credibilidade dos 
proferimentos ficam ameaçados a ponto de tornarem a fala prejudicial à busca do 
equilíbrio. Em apenas uma rodada de conversa, a sinalização e o comprometimento 
não conseguem se impor, pois uma mensagem do tipo “farei assim e espero que você 
também o faça” não é suficiente para garantir a credibilidade, embora o significado 
de todos os termos sejam compreensíveis aos falantes de uma língua natural qualquer 
que permita a construção de tal expressão. O que está em jogo não é um mero enten- 
dimento sobre o significado da frase, mas a melhor distribuição dos saldos disponíveis. 


Na Batalha dos Sexos, o equilíbrio dado pela conversação mantém-se graças às 
perdas advindas de uma possível deserção, enquanto no Dilema dos Prisioneiros, o 
contrário acontece. Ao desertar, uma parte tem tudo a ganhar, se o outro seguir a es- 
tratégia cooperadora. Para todos envolvidos, a deserção mútua permanece sendo uma 
opção superior ao resultado frustrante de uma atitude amigável que não é correspon- 
dida. A aversão ao risco faz da estratégia maximin — que maximiza os ganhos mínimos 
— dominante sobre os pagamentos cuja multiplicação produz o maior resultado numa 
fronteira de eficiência, a cooperação mútua. 


Nesse cenário, a comunicação exerceria uma função nula e supérflua. As res- 
trições feitas à troca de informações visam, então, impedir que ameaças sejam feitas 
entre os participantes. Contudo, experiências realizadas em laboratório demonstram 
que o diálogo entre os agentes acaba por transformar esse dilema — um jogo não coope- 


124 Veja AUMANN, R. J. & HERT, S. “Long Cheap Talk”; FARRELL, ]. “Meaning and Creability in Cheap Talk 
Games” e FARRELL, ]. & RABIN, M. “Cheap Talk”. 








rativo —, num jogo de cooperação entre pessoas dispostas a correrem riscos moderados. 


Na prática, rodadas que se prolongam com o tempo favorecem o surgimento da reci- 
9 
procidade e a consequente confiança na colaboração!?. 


As motivações que concorrem para transformação do Dilema dos Prisioneiros 
em cooperação possuem, portanto, ingredientes de fundo psicológico e cognitivo. Psi- 
cológico, porque a proximidade dos agentes, a reciprocidade das respostas, um padrão 
subjetivo de confiabilidade e a percepção do outro como uma instância dotada de in- 
tenções semelhantes estimulam um comportamento cooperativo. Cognitivo, devido às 
inferências que são feitas tanto para o entendimento do significado dos enunciados 
emitidos, como na aferição das maiores vantagens em continuar agindo em função 
dos acordos estabelecidos, a despeito dos lucros imediatos de uma deserção que, no 
entanto, acabariam por gerar prejuízos futuros, oriundos de uma retaliação esperada, 
por parte do outro. À comunicação, então, requer a mobilização de outros fatores 
alheios ao âmbito da linguagem, tais como credibilidade, reciprocidade e convivência 
prolongada. 


Arranjos típicos do Dilema dos Prisioneiros servem para mostrar os problemas 
de aplicação de normas morais aceitas argumentativamente como válidas. Não basta 
apenas que se diga em uníssono “faça assim, que o farei também” ou “todos devem co- 
operar”. O contexto em que a aceitação é produzida força o envolvimento e apresenta 
os desafios que as partes devem resolver mutuamente. Perante o balanço dos danos e 
benefícios causados por uma empresa conjunta, os participantes veem surgir a dimen- 
são moral — a necessidade da concordância do outro — e o valor prático universal da 
norma candidata à lei, motivador do cumprimento dos contratos firmados. 


Nem todos jogos se prestam ao uso efetivo da comunicação. À permissão de uma 
conversa barata antes da escolha de uma linha de ação não acrescenta coisa alguma ao 
destino de jogos de soma zero com informação perfeita, onde sempre há uma estratégia 
estritamente determinada que garante a vitória ou ao menos o empate a um dos joga- 
dores. A discussão também é inútil quando neologismos e o significado dos conceitos 
empregados não são entendidos pelos falantes, colidindo com um dos pressupostos 
pragmáticos da argumentação. Some-se a isso que a falta de credibilidade torna vão os 
esforços empreendidos nos debates, por menos custosos que sejam. 


Todos poderiam, por hipótese, aceitar a validade dos 10 Mandamentos, do impe- 
rativo categórico, dos princípios de justiça etc., numa situação de fala ideal. Entretan- 
to, do ponto de vista instrumental, nenhum argumento racional impediria o homem 
econômico de seguir a maximização irrestrita de sua utilidade esperada, a despeito de 
uma alegada contradição performativa, toda vez em que encontrasse uma estratégia 
que garantisse seus ganhos maiores. Apenas quando as informações individuais sobre 
os lances de um jogo são incompletas, ou há incerteza na obtenção de algum resultado 
mais favorável, a comunicação pode vir a desempenhar um papel decisivo, produzindo 
o entendimento no ouvinte de que o falante intenciona fazer algo cujo conteúdo é o 
significado a ser compreendido. 


A comunicação, portanto, parte da intenção do falante de que o ouvinte com- 
preenda o que se quer dizer quando a mensagem foi transmitida. Em sua forma direta, 
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explícita, a troca de mensagens é mais eficiente que o recurso aos pontos focais de uma 


comunicação tácita ou implícita. Ao invés de um encontro “casual”, influenciado por 
um conhecimento comum ou pela topologia ambiental, os falantes podem simples- 
mente indicar o lugar preciso onde estarão e resolver facilmente a Batalha dos Sexos 
ou modelos semelhantes. Noutras palavras, a conversa preliminar, sempre que possí- 
vel, conduz a resultados melhores do que a coordenação feita por convenções populares 


ou formais, desde que haja o uso pleno de mensagens compreensíveis por todos!"”. 


Dom Natural 


A ideia de uma racionalidade moldada pela evolução natural das espécies admite 
que possa haver problemas não só para execução perfeita de estratégias, mas também 
para a produção de um entendimento mútuo entre emissores e receptores interessa- 
dos, principalmente, com sua sobrevivência e reprodução. Se, por um lado, a razão 
estratégica perfeita ainda não foi alcançada e sofre com a incontinência ou o conflito 
de diversos interesses individuais, o agir comunicativo, por sua vez, tem de enfrentar a 
falta de credibilidade e significado das expressões em certos contextos de aplicação. Na 
natureza, há exemplos de seres vivos que emitem informações falsas sobre si mesmo 
— mimetismo — ou algum acontecimento — a presença de um inimigo —, obtendo assim 


chances de ganhar proteção ou maior quantidade de alimento!?”. 


Naturalmente, a comunicação pode ter surgido e sido mantida graças a sua po- 
tencial capacidade de promover o bem dos indivíduos. Contudo o seu uso exclusivo 
em finalidades particulares restritas que poderiam prejudicar o outro tiveram origem, 
paradoxalmente, na eficácia desse processo comunicativo. Foi porque a troca de infor- 
mação inspirava à primeira vista a credibilidade de todos que captavam a mensagem, 
constituindo-se num meio efetivo de fomentar os interesses individuais na luta pela 
sobrevivência, que espécies mutantes passaram a empregar tal mecanismo apenas em 
proveito próprio. 


Um Dilema dos Prisioneiros está em curso no desenvolvimento do agir comuni- 
cativo. Transmitir uma informação falsa pode trazer maiores vantagens para o emissor 
e prejuízos para o receptor. Entretanto, essa atitude, se costumeira, poderá gerar a 
desconfiança que prejudica a todos quando uma mensagem perde sua credibilidade. 
Melhor seria, então, transmitir sempre expressões válidas que, embora gerassem um 
ganho menor para o emissor, manteriam o recurso comunicativo passível de ser aplica- 
do com sucesso no futuro. À percepção da necessidade de transmissão de enunciados 
verazes depende portanto de fatores extralinguísticos — os interesses dos indivíduos na 
manutenção de um instrumento que auxilia na sua sobrevivência — que vão além dos 
limites ilocucionários. 


Na espécie humana, para a comunicação atingir o entendimento mútuo em tor- 
no de uma linha de ação comum a todos, faz-se necessário o recurso a efeitos perlo- 
cucionários de esclarecimento e convencimento do outro, que mostrem também as 
vantagens que se terá com a satisfação de seus interesses ao agir no sentido do conte- 
údo expresso na mensagem. Todos devem perceber o que têm a ganhar colaborando 
para formação e implementação do consenso, ainda que momentaneamente seja mais 
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vantajoso para um deixar que o outro cumpra a sua parte sozinho, enquanto puder 


desfrutar das vantagens dessa exploração, sem nada fornecer em troca. Mostrar que 
7 

a comunicação constitui a estratégia mais adequada para estabelecer normas úteis 

para todos exige a compreensão de que a comunicação surgiu como um instrumento 

desenvolvido ao longo da evolução natural e que se mantém devido a sua eficácia na 

promoção dos interesses vitais, aos quais ela se vincula. 


Não há, pelo menos enquanto a espécie Homo s. sapiens for como tal — racional, 
sensível e mortal —, um modo seguro de planejar uma decisão formal precisa que su- 
pere esses embaraços psicológicos definitivamente. Nenhuma teoria moral sustentada 
tão somente em pressupostos da razão (instrumental, prática ou comunicativa) está 
livre das armadilhas psicológicas e das pressões ambientais. Estimativas que consi- 
derem as probabilidades de um evento acontecer estão sujeitas a equívocos descon- 
certantes, graças à indeterminação natural dos fenômenos e à tendência em evitar o 
mal e perseguir o bem para si, seja lá o que isso for: maximizar a duração da vida e a 
distância da data fatal. 


A Teoria dos Jogos detecta tais armadilhas na intransitividade das preferências 
que torna a função de utilidade de von Neumann-Morgenstern “impraticável”, na 
maioria dos indivíduos desinformados. De forma semelhante, os problemas de apli- 
cação enfrentados pela Ética do Discurso decorrem da desconfiança sobre as motiva- 
ções inseridas num pano de fundo específico. O que impede a desejável efetivação de 
normas que poderiam ser respaldadas pelo consenso dos participantes numa situação 
de fala ideal. Na compreensão adequada do contexto real, ações estratégicas e comu- 
nicativas precisam atuar de maneira complementar no intuito de esclarecer os desvios 
cometidos pelas pessoas em suas deliberações e apontar mecanismos auxiliares que 


promovam a cooperação em busca dos melhores resultados para todos. 








Capítulo 3 
A Evolução da Cooperação 


esde quando foi aplicado pela primeira vez - lá pelos idos de 1950 -, o Dilema dos 

Prisioneiros causou estranheza aos seus inventores e ao próprio John Nash, cuja 
tese dos pontos de equilíbrio era alvo principal dos problemas apresentados aos seus 
jogadores. Melvin Dresher e Merril Flood criaram esse modelo de jogo com a intenção 
de gerar uma situação paradoxal para a ideia de que havia um ponto de equilíbrio em 
jogos não-cooperativos. O Dilema dos Prisioneiros foi repetido por cem rodadas suces- 
sivas entre duas pessoas racionais, mas que nunca tivessem ouvido falar em pontos de 
equilíbrio. O resultado foi a emergência da cooperação entre os agentes - que repar- 
tiam igualmente os prejuízos -, contrariando a previsão de que deveriam aplicar suas 
respectivas estratégias dominantes - sempre desertar -, atingindo assim o ponto de 
equilíbrio do jogo. Na época, Nash já teria sugerido que o resultado contraditório ob- 
tido devia-se ao fato dos jogadores estarem participando de um autêntico superjogo, 


no qual vários movimentos repetem a mesma condição de escolha das estratégias!?. 


A previsão da teoria dos jogos e do equilíbrio de Nash era que agentes racionais 
egoístas optassem sempre por sua estratégia dominante quando esta existisse, inde- 
pendente do que o outro fizesse. No Dilema dos Prisioneiros, as duas partes possuem 
estratégias desse tipo e o resultado esperado é a deserção mútua e a punição com a con- 
denação dos dois presos pelo crime mais grave, ao invés de uma pena leve relativa ao 
delito pelo qual foram capturados. A partir da interface policial montada por Albert 
Tucker, logo se compreendeu que o Dilema dos Prisioneiros poderia ser a estrutura 
simplificada de uma série de interações entre pessoas, empresas e até mesmo nações, 
em larga escala. 


A despeito do jogo ter sido elaborado para refutar a teoria de Nash, o Dilema dos 
Prisioneiros Iterado logo se mostrou uma importante ferramenta de análise da pos- 
sibilidade de cooperação entre os agentes racionais egoístas, sem que fosse necessária 
a intervenção de uma autoridade exterior que impusesse um acordo entre as partes. 
Jogado em um só movimento, não haveria como os participantes colaborarem entre si, 


caso não tivessem tido a chance de combinarem uma conduta prévia - a mítica honra 
128 Veja NASAR, S. Uma Mente Brilhante, cap. 12, p. 149. 








entre ladrões, por exemplo. Para que isso acontecesse, teria de haver várias rodadas de 
conversação anteriores à fase de ação - conforme o modelo de longas conversas baratas, 
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de Aumann e Hart!?. Fato que alteraria a montagem do dilema, transformando-o em 


um jogo falado, onde a comunicação exerce uma função crucial", 


Em sua formulação original, jogado apenas de uma vez, esse tipo de situação 
serve como exemplo contrafactual à hipótese de Adam Smith (1723-1790) de que uma 
“mão invisível” conduziria a distribuição equilibrada dos bens necessários à vida, en- 
tre ricos e pobres! Seres egoístas e racionais agiriam, na verdade, como os fazendeiros 


imaginados por Hume e não colaborariam uns com os outros"? 


- Não obstante, expe- 
rimentos iniciais com o Dilema dos Prisioneiros Iterado mostraram que a cooperação 


poderia surgir entre os participantes, ao longo de vários lances repetidos. 


Evolução da Teoria da Cooperação 


Em 1984, Robert Axelrod apresentou, no livro The Evolution of Cooperation, 
uma descrição da maneira pela qual o Dilema dos Prisioneiros Iterado, repetido por 
várias rodadas, pode privilegiar a escolha da cooperação, mesmo em seres irracionais 
tão simples como bactérias e, aparentemente, sem nenhum aparato linguístico. O pro- 
jeto começou tentando responder a questão sobre quando as pessoas cooperam ou 
são egoístas umas com as outras nas interações entre elas. O Dilema dos Prisioneiros 
parecia então ser um modelo que representava adequadamente tal possibilidade de 
interação. Para explorar em detalhes o comportamento estratégico que poderia ser 
adotado aí, teóricos ou especialistas de cinco disciplinas afins - matemática, economia, 
ciência política, sociologia e psicologia - foram convidados a participar de um torneio 
de computador, programado para executar o Dilema dos Prisioneiros. Ao lado de uma 
regra randômica - que colabora ou deserta metade das vezes -, foram submetidas ao 
teste virtual 14 estratégias diferentes elaboradas por esses especialistas. 


A estratégia vencedora foi TIT FOR TAT (OLHO POR OLHO - OPO, ou o li- 
teral ISTO POR AQUILO, também traduzida como PAGAR NA MESMA MOEDA), 
um comando simples que começava o jogo cooperando com o adversário e repetindo 
depois a mesma ação que o outro jogador tivesse feito no movimento anterior. Após 
o conhecimento desse resultado, Axelrod propôs um novo torneio ampliando a par- 
ticipação a todos os interessados, incluindo professores de biologia, física, ciência da 
computação e fanáticos por jogos eletrônicos. Especialistas de seis países participa- 
ram do segundo campeonato, apresentando 62 programas diferentes que disputavam 
com RANDÔMICA em cinco rodadas, cuja média de movimentos era de 151 lances, 
pois o jogo dessa vez não tinha um limite determinado para seu encerramento, que 
no máximo chegava a 308 movimentos. Mais uma vez, OLHO POR OLHO venceu a 
competição. 


O sucesso de OPO provocou o desdobramento da pesquisa para um cenário evo- 
lutivo, onde se procurou interpretar a execução das estratégias em contextos não co- 
operativos, com diversos tipos de rivais empregando suas respectivas linhas de ação, 
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sendo que a melhor destas deveria ser resistente a invasões em seu território. Das estra- 


tégias apresentadas, OPÔ mostrou-se passível de ser adotada por aqueles minúsculos 
organismos por causa de sua simplicidade e clareza. Mostrou-se também vitoriosa na 
maioria das circunstâncias e no enfrentamento da maior parte das estratégias concor- 
rentes, privilegiando a formação do equilíbrio de Nash'*. 


Os motivos para a tendência cooperadora prevalecer num ambiente de pura com- 
petição, como é a natureza, devem-se a certas condições circunstanciais que contri- 
buem para o êxito de OPO. A proximidade entre indivíduos, ainda que egoístas, e 
as interações repetidas permitem que a reciprocidade das ações surja num segundo 
momento, desde que os organismos sejam dotados com aparelhos capazes de fazerem 
a marcação, rotulagem, e o posterior reconhecimento desses rótulos. Assim, é possível 
discriminar no instante seguinte aqueles que antes cooperaram ou não. À reunião de 
indivíduos em grupos de cooperadores/retaliadores proporciona a formação de uma 
vizinhança resistente a invasões de oportunistas/exploradores. Fenômeno tão próximo 
de cada um que mal é percebido: o sistema imunológico composto por células que rotu- 
lam, identificam e atacam os vírus e bactérias que a todo momento invadem os corpos 


dos seres vivos! 


- OPO evita conflitos desnecessários, enquanto todos agem de modo 
recíproco, respondendo de imediato às deserções não motivadas, mas logo esquecendo 
as provocações passadas após o retorno à cooperação. A transparência das intenções 
e, por conseguinte, a facilidade de identificação do padrão de conduta dos agentes es- 
timula o cumprimento dos “compromissos” assumidos, assim, tacitamente, através de 


um consenso implícito", 


A facilidade do reconhecimento e a simplicidade de execução de estratégias recí- 
procas, com características de gentileza (nice), retaliação, clemência (forgiving) e cla- 
reza, fazem de comportamentos como os prescritos pela estratégia OPO uma linha de 
ação robusta, estável e viável em circunstâncias onde a comunicação atua na sua for- 
ma mais rudimentar, na transferência de informações mínimas (bytes). Basta apenas 
que os agentes sejam capazes de reconhecer em contatos repetitivos as ações amigáveis 
ou não e responder adequadamente cooperando ou desertando daqueles que no passa- 
do imediato foram rotulados como cooperadores ou desertores. À consolidação desse 
comportamento com o tempo acaba por gerar um processo de “aprendizagem” que nos 
seres irracionais se dá com o sucesso evolutivo da proliferação em gerações futuras dos 
genes “retaliadores”, aqueles que “sabem” aplicar OPO e, por conta disso, sobrevive- 
ram em maior número de indivíduos. 


Importante notar que os arranjos dos torneios originais que propiciaram a vi- 
tória de OPO permitiam somente lances em que cooperar (C) e desertar (D) eram 
escolhidas em estratégias puras, deterministas, isto é, sem variação da probabilidade 
que promovesse estratégias mistas. Axelrod delineou os confrontos deixando de lado a 
ocorrência de erros ou ruídos na escolha entre C e D. Supôs também que era indiferen- 
te as rodadas serem executadas de maneira simultânea ou alternada. De todo modo, 
a comunicação anterior aos lances estava vedada, sendo cada movimento realizado 
silenciosamente. Os jogadores tomavam conhecimento das escolhas de seus oponentes 
imediatamente após elas terem sido feitas. 
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A Teoria da Cooperação proposta por Axelrod baseou-se, então, na investiga- 


ção de como indivíduos que visam satisfazem seus próprios interesses podem cooperar 
entre si, sem ajuda de uma autoridade central que os forçassem a isto". A tradição 
moderna tem no contrato social sua resposta ao modo como a cooperação poderia 
emergir. No entanto, o contratualismo precisa que haja um terceiro elemento entre as 
partes ao qual se possa recorrer, a fim de que os acordos sejam mantidos por todos en- 
volvidos. Porém, há circunstâncias onde, apesar de não existir uma entidade que possa 
mediar e resolver as divergências, a cooperação deve surgir sob pena de todos terem de 
arcar com os prejuízos de uma competição generalizada. 


Assim, o comércio internacional tem de solucionar seus problemas segurança, 
tarifas e pirataria com o emprego de estratégias adequadas que não exijam o apoio 
de elementos externos às relações entre as partes concernidas. Em meio a um poder 
político autônomo, como o parlamento em sociedades democráticas, o conflito de inte- 
resses deve ser resolvido pelos membros de cada setor sem a interferência de um outro 
poder constituído - executivo ou judiciário, por exemplo. Nesses e em outros casos, é 
necessário que os agentes cooperem sob pena de obterem os piores resultados possíveis. 


Dessa forma, o Dilema dos Prisioneiros veio a calhar como modelo de jogo que 
representava, em suma, a situação em que o uso de estratégias dominantes pelas par- 
tes, ao satisfazerem seus próprios interesses, resultassem em um ganho baixo a todos 
Jogadores. Ademais, a estrutura do jogo não permitiria que nenhum mecanismo de 
ameaça ou promessa estivesse disponível. a informação imperfeita também impedia 
que um jogador soubesse o que o outro viesse a fazer na sua vez de jogar. Todos par- 
ticipantes seriam hábeis para realizarem suas estratégias e não haveria como alterar 
os valores obtidos com pagamentos laterais (propinas), mudando também a função de 
utilidade do outro. 


Com a repetição da interação entre os agentes, foi possível notar os efeitos que 
a sombra do futuro pôde exercer sobre o comportamento dos mesmos. À medida que 
o jogo avança, a confiança entre as partes aumentava na mesma proporção em que a 
desconfiança, quando o final do jogo se aproximava. Tornar o final da partida inde- 
terminado favoreceu a manutenção do comportamento cooperativo. Quanto maior 
fosse a distância a ser percorrida no futuro, tanto maior a dependência da escolha 
das estratégias, segundo a conduta adotada pelo outro. Uma estratégia de “retaliação 
permanente” - cooperar até que o outro deserte, então sempre desertando em seguida 
-, por exemplo, poderia ser facilmente explorada por alguém que conhecesse o prazo 
do término do jogo, sendo tentado a não cooperar nas últimas movimentações. Porém, 
esse estímulo não haveria se a data final fosse incerta e a expectativa de uma longa 
punição até o término da partida fosse grande. 


Outro fator que preponderou na escolha do Dilema dos Prisioneiros como ma- 
triz básica da teoria da cooperação foi o fato de sua estrutura ser tão simples que, a 
rigor, não era essencial que os participantes fossem racionais ou tivessem consciência 
das escolhas que estavam fazendo. Nem sequer precisariam tentar maximizar suas 
recompensas, bastando apenas que fossem capazes de aplicar um padrão de compor- 
tamento, procedimentos, hábitos, instintos ou imitação como faz a maioria dos seres 
vivos. Nesse sentido, as ações implementadas podem ser executadas sem que o proces- 
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so deliberativo seja compreendido pelo agente. Assim, no âmbito mais amplo, a teoria 
da cooperação poderia envolver pessoas, firmas, nações ou bactérias, em uma teoria 
geral dos jogos evolutivos, nos quais as estratégias vitoriosas são passadas às gerações 
futuras pelo sucesso, ou não, de um programa genético, que determine as ações dos 
indivíduos". 


Apoiada fortemente na reciprocidade, a teoria da cooperação de Axelrod cha- 
mou atenção para a importância do conceito de evolução na escolha de um equilíbrio 
dentre infinitas possibilidades existentes em jogos repetidos várias vezes. Aqueles as- 
pectos cujos fatores ajudaram também a compreender melhor o papel da comunicação 
nesse processo evolutivo. 


$7. Os Torneios e a Estratégia TIT FOR TAT 


O uso de computadores para realização de testes de simulação não era uma novi- 
dade nos anos 1980. Já na primeira edição de O Gene Egoísta (1976), Richard Dawkins 
informava que programas estavam sendo empregados “em todos os campos onde a 
previsão futura é necessária”, Assim, pesquisadores de áreas como economia, ecolo- 
gia, sociologia, psicologia além dos estrategistas militares, estavam aplicando modelos 
simplificados de aspectos do mundo trabalhados por suas respectivas teorias. Ás simu- 
lações eletrônicas traziam a vantagem de reduzir o tempo necessário para observação 
dos efeitos de uma ação, caso esta viesse a ser desempenhada no contexto real. Apesar 
de serem apenas aproximações virtuais da realidade, as simulações funcionavam como 
substitutas eficientes à prática da tentativa e erro aleatória. 


Nesse sentido, a inovação que Robert Axelrod trouxe com seus campeonatos 
de computadores foi a de, ao permitir a participação de especialistas de outras disci- 
plinas, buscar entre os vários programas e estratégias submetidos aqueles que apre- 
sentassem as propriedades necessárias para uma linha de ação eficaz nos contextos 
virtuais e que possivelmente se aplicariam aos ambientes concretos da vida. Como 
toda simulação, os torneios de Axelrod procuraram delimitar o conjunto de elementos 
mais relevantes para elaboração, manipulação e previsão dos resultados admissíveis, 
diante das alternativas disponíveis. Axelrod, que é cientista político da Universidade 
de Michigan, evitou apontar, depois de terminados os certames, uma estratégia que 
fosse considerada a melhor em todas as circunstâncias imaginadas, enfatizando que 
a escolha depende em parte do que se espera que o outro fará em face da expectativa 
que este tem sobre o que o sujeito também fará". A situação típica de uma racionali- 
dade estratégica que obriga cada agente a considerar as intenções de todos envolvidos, 
recursivamente. 


O Dilema do Prisioneiro Iterado (DPI) foi o modelo escolhido por apresentar a 
possibilidade de desenvolvimento de uma rica faixa de estratégias que poderiam ser in- 
terpretadas como sendo correspondentes a vários contextos do mundo da vida, monta- 
das sobre o pano de fundo de jogos de soma variante, quando os interesses dos agentes 
envolvidos em parte coincidem, em parte entram em conflito. Além de levar em conta 
as reações esperadas dos outros, o sucesso de cada uma dependeria da capacidade de se 
ter em “mente” o histórico das relações passadas e seu posterior desdobramento. 

131 Veja AXELROD, R. Ibidem, part. 1, cap, 1, pp. 11 a 19. 
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(...) Em um torneio de computador, cada entrada descreve um 
programa que incorpora uma regra para selecionar a escolha 
cooperativa ou não cooperativa em cada movimento. O pro- 
grama dispõe para isto do histórico do jogo, e pode usar essa 


história para deliberar.(...) (AXELROD, R. The Evolution of 
Cooperation, part. IL, cap. 2, p. 30). 


Figura 3.1 - Modelo Padrão do DPI 
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O modelo padrão do Dilema dos Prisioneiros segue a matriz da figura 3.1, na 
qual são distribuídos os pontos para Tentação (T) de Desertar (D) sozinho, a Recom- 
pensa (R) pela Cooperação (C) mútua, a Punição (P) por ninguém cooperar e a posição 
de Simplório (S de Sucker), que se deixa explorar pelo outro. Tais pagamentos devem 
ser obtidos sob duas condições. A primeira determina que a tentação seja superior à 
recompensa, está à punição e por último o ganho do simplório (T> R> P>S). Em 
segundo lugar, a recompensa deve ser maior ou igual à média entre a tentação e sim- 
plório (R > (T + S)/2). Sendo assim, Axelrod propôs a matriz da figura 3.2 como base 
de pontuação. Com cinco pontos para o jogador que deserta, enquanto o outro coope- 
rador não ganha nada. Três pontos foram para cooperação mútua e um ponto para a 
deserção mútua. 


Figura 3.2 - Dilema dos Prisioneiros 
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Ao lado da estratégia RANDÔMICA - cooperar e desertar com probabilidade 
igual -, 14 outros programas foram inscritos no primeiro turno do campeonato por 
especialistas de cinco disciplinas: psicologia, economia, ciência política, matemática 
e sociologia. Nessa primeira fase, o torneio foi disputado em 200 movimentos até o 
final. De modo que, aqueles que sempre cooperassem entre si, ganhavam a soma de 
600 pontos cada um de um placar máximo de 1000 pontos, o que ocorreria se alguém 
conseguisse explorar um cooperador do início ao fim da partida sem sofrer retaliação. 
Todas entradas interagiam entre si - duas a duas -, com os programas sendo escritos 
em formato e linguagem comuns a todos. 


Nem a complexidade ou simplicidade, nem o peso ou largura dos programas 
foram características significativas para determinar a vitória no primeiro concurso. A 
estratégia vencedora TIT FOR TAT (OLHO POR OLHO, OPO), apresentada pelo 
psicólogo canadense Anatol Rapoport, mereceu esse resultado devido às propriedades 
destacadas por Axelrod na análise feita de seu desempenho. 


Olho por Olho 


Para Axelrod, OPO teria vencido a primeira fase do torneio por ter sido uma es- 
tratégia considerada gentil (nice) e clemente (forgiving) frente às outras. OPO sempre 
começava uma partida cooperando e, mesmo depois de retaliar uma deserção, retorna- 
va à cooperação esquecendo o desvio feito no passado pela outra parte - que recebera 
uma punição imediata. À estratégia OPO sempre coopera com o oponente até que este 
deixe de cooperar, imitando em seguida o comportamento deste. Com isso, essa estra- 
tégia evitaria o efeito de “eco”, que pode ocorrer após a punição de uma deserção, caso 
ela gere uma longa cadeia de retaliação e contrarretaliação. 


Axelrod sugeriu que, apesar da vitória de OPO, “seria fácil encontrar muitas 
regras que poderiam ter desempenhado substancialmente melhor do que OLHO POR 
OLHO no ambiente do torneio”!". Ele mesmo sugeriu que três estratégias poderiam 
ter vencido a primeira disputa se tivessem sido inscritas. TIT FOR TWO TATS (UM 
OLHO POR DOIS OLHOS, OP20) poderia ter sido uma delas, pois é uma variante 
mais clemente do que OPO, só pune se não tiver havido cooperação nos dois movi- 
mentos anteriores. O provável sucesso de OP20 seria devido à importância do perdão, 
muitas vezes negligenciado pelos especialistas. LOOK AHEAD (OLHE ADIANTE) é 
uma estratégia elaborada com base em recursos de inteligência artificial, aplicada ao 
xadrez, que também poderia ter ganho o torneio se tivesse sido submetida. Por fim, 
uma versão otimista do programa apresentado pelo psicólogo estadunidense Leslie 
Downing seria aquela que obteria a maior média entre todas as quinze concorrentes. 


A DOWNING REVISADA deveria começar avaliando os outros jogadores como 
responsáveis, ao invés de não cooperadores irresponsáveis, como fazia a DOWNING 
original. No primeiro torneio, OPO conseguiu a média de 504 pontos. Ao passo que, 
essas três últimas estratégias, deixadas de fora inicialmente, quando foram testadas 
no contexto do primeiro campeonato, obtiveram 520 pontos, OLHE ADIANTE; 532, 
OP20; e 542, DOWNING REVISADA. Isso serviu para reforçar a ideia da inutilida- 
de de encarar de modo estritamente competitivo o DPI e a vantagem de se mostrar 
clemente às deserções - além da hipótese de que não há uma estratégia vitoriosa em 
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absoluto no contexto do Dilema dos Prisioneiros Iterado. 


No intuito de pôr à prova mais uma vez as conclusões extraídas da primeira fase, 
um segundo turno de rodadas foi sugerido para um número maior de participantes, 
incluindo representantes de seis países - Canadá, Estados Unidos, Grã-Bretanha, No- 
ruega, Nova Zelândia e Suíça - e de outras disciplinas ou atividades, como biólogos 
evolutivos, professores de informática e fãs de jogos eletrônicos. Dessa vez, no entanto, 
os efeitos do “lance final” foram amenizados com a determinação de uma taxa de va- 
riação que indicava a chance de terminar o jogo no próximo movimento, em 0.00346 


por cento. Também foram admitidos programas nas linguagens FORTRAN e BASIC. 


Das 63 propostas encaminhadas, novamente, OPO saiu-se vencedora, com 434.73 
pontos na média, mesmo depois de um relatório ter sido divulgado com a análise da 
disputa anterior. Outras duas propriedades se mostraram decisivas para explicar a 
robustez dessa estratégia: sua clareza e capacidade retaliadora. 


(...) Uma regra pode ser chamada retaliadora se deserta imedia- 
tamente após uma deserção “imotivada” do outro. Exatamen- 
te o que significa “imotivada” não é determinado precisamente. 
O ponto, contudo, é que ao menos uma estratégia é incitada a 
uma resposta imediata por um desafio do outro jogador. (...) 


(AXELROD, R. Op. cit., idem, p. 44). 


A eficiência de uma estratégia gentil - que sempre começa cooperando - depende 
de seu poder de retaliação. A promissora OP20, que venceria OPO no campeonato 
anterior, não obteve o sucesso esperado por ter se defrontado com estratégias como a 
TESTADORA, que eram capazes de explorar a sua demora em punir a outra estraté- 
gia que desertou ao menos uma vez nas duas rodadas prévias. O eminente biólogo evo- 
lutivo, o britânico Maynard Smith, candidatou OP20, mas só conseguiu o 24º lugar. 


Por terem sido anunciadas as vantagens em ser gentil e clemente, como caracte- 
rísticas decisivas do primeiro campeonato, a maioria dos novos concorrentes do segun- 
do turno procurou atacar alguma vulnerabilidade presente nessas afirmações, apre- 
sentando programas que visavam derrubar tais hipóteses. OPO, entretanto, provou 
ser robusta a esses ataques e a sua imediata retaliação foi um ponto forte para sua 
manutenção na primeira posição. Sua robustez foi testada mais tarde até em variantes 
evolutivas do segundo campeonato, onde as estratégias bem-sucedidas teriam maior 
número de descendentes nas gerações futuras. Comprovando os resultados obtidos em 
situações típicas estudadas antes por Dawkins, em O Gene Egoísta, por Maynard Smi- 
th, em “The Evolution of Behavior” (1978), e por Robert L. Trivers, em “The Evolution 
of Reciprocal Altruism” (1971). 


A análise ecológica mostrou que ir bem com regras que não fa- 
zem boa pontuação com elas mesmas é eventualmente um pro- 
cesso de autodestruição. Não ser gentil pode parecer promissor 
no início, mas ao longo do tempo, isto pode destruir muito o 
ambiente necessário para seu sucesso (AXELROD, R. Idem, 


ibidem, p. 52). 


A vitória de OPO no cenário evolutivo serviu para provar não que esta fosse a 


melhor estratégia para todas situações, mas que sua persistência indicava ser a mais 








adequada para uma ampla variedade de ambientes. Por ser fácil de encontrar, de ser 
reconhecida e difícil de explorar, OPO destacou-se também por sua clareza. 


(...) O sucesso da robustez de OLHO POR OLHO é uma combi- 
nação de ser gentil, retaliadora, clemente e clara. Sua gentileza 
previne de se meter em problemas desnecessários. Sua retalia- 
ção desencoraja o outro lado de persistir, sobretudo quando a 
deserção é tentada. Sua clemência ajuda a restaurar a coopera- 


ção mútua. E sua clareza a faz inteligível ao outro jogador, pela 
qual se deduz uma cooperação longa (AXELROD, R. Ibidem, 
ibidem, p.54). 


A estratégia OPO encontra uma correspondência no comportamento Rancoroso 
e Retaliador descritos por Dawkins, para o jogo Pombos e Falcões, onde são colocados 
os exemplos tirados de uma simulação feita em computadores a partir das análises de 


Mi De tudo isso, 


Maynard Smith sobre as estratégias evolucionárias estáveis (EEE) 
vem a conclusão de que a reciprocidade é a base dos comportamentos aptos a gerar a 
cooperação entre os seres vivos. Reciprocidade que está estampada na chamada Regra 
de Ouro - faça aos outros o que gostarias que fizessem a ti -, talvez seja a regra fundamen- 
tal da ética que, no inventário registrado pelo filósofo australiano Peter Singer, está 
presente nas mais diversas culturas e nos momentos históricos mais distintos, desde o 


código de Hamurabi até as tentativas atuais de elaboração de uma Declaração Univer- 
sal de Uma Etica Global. 


(...) A Regra de Ouro está presente, com distintas formulações, 
numa ampla variedade de culturas e de ensinamentos religio- 
sos, abrangendo, numa ordem mais ou menos cronológica, os 
de Zoroastro, Confúcio, Mahavita, do Buda, do épico hindu 
Mahabharaita, do Levítico, de Hillel, de Jesus, de Maomé, e de 
Kant, entre outros. Fez-se na última década a tentativa de ela- 
borar a “Declaração de uma Ética Global”, uma declaração 
de princípios universalmente aceitos em todas as culturas. (...) 
Uma delas, esboçada pelo teólogo Hans Kiing e aprovada no 
Segundo Parlamento Mundial de Religiões, começa com a exi- 
gência fundamental de que “todo ser humano tem de ser tra- 
tado humanamente”. Ao tornar mais precisa a exigência, essa 
versão se refere à Regra de Ouro como a norma irrevogável e 
incondicional para todas as áreas da vida. (...) (SINGER, P. 
Um Só Mundo, cap. 4, p. 183). 


A divulgação das ideias contidas no livro de Axelrod aumentou o interesse pelo 
DPI. Por conta disso, muitas observações foram feitas sobre o modo como os torneios 
foram preparados e a pretensão de validade das características as quais se atribuíram 
o sucesso de OPO. Ao longo de duas décadas, diversos artigos foram escritos sobre o 
assunto, abordando os fatores como alternância dos movimentos, a oferta de garan- 
tias, a interação entre redes sociais, a troca de informação, em função do reforço da 
reputação, a aprendizagem do comportamento, o papel da inveja, da confusão e a 
possibilidade de se abandonar o jogo. 


141 Veja DAWKINS, R. Op. cit. cap. 5, pp 99 e ss, e cap. 10, pp. 206-208. 








Em resposta a tantas observações, vários outros artigos foram lançados por 
Axelrod, só ou em parceria com outros autores, defendendo a possibilidade de se cobrir 
a maior parte das variações do modelo de DPI, com a formulação de uma família de 
estratégias derivadas de OPO. Essa nova família de estratégias poderia então atender 
os desafios de um repertório mais abrangente de relações. Não obstante, a teoria da 
cooperação desenvolvida por Axelrod trouxe uma nova compreensão sobre o compor- 
tamento recíproco entre os seres vivos que precisava ser elaborada de uma forma mais 
plausível, frente aos paradoxos de uma concepção egoísta de indivíduos preocupados 
com sua sobrevivência e reprodução. 


Em 2004, foi realizada uma competição comemorativa do 20º aniversário do pri- 
meiro torneio de 1984, com 223 entradas jogadas cada uma contra todos os outros 
jogadores. À estratégia vencedora foi um dos 60 programas inscritos pela equipe da 
Universidade de Southampton, da Inglaterra. A variação campeã foi desenhada para 
executar uma série de cinco de dez movimentos, através dos quais reconhecia cada 
uma de suas variantes. Quando dois jogadores SOUTHAMPTON se encontravam, 
assumiam imediatamente os papéis de “senhor e escravo” - um poderia sacrificar-se 
para que o outro vencesse várias vezes. Caso reconhecesse uma estratégia rival, SOU- 
THAMPTON desertava imediatamente. Destarte, o trabalho de equipe permitiu a 
essa estratégia tomar os três primeiros lugares, enquanto alguns dos que se sacrifica- 
ram ocuparam as últimas posições na tabela. 


O responsável pela edição comemorativa do DPI, Graham Kendall, da Escola 
de Ciência da Computação e Informática da Universidade de Nottingham, notou que 
uma estratégia com múltiplos jogadores, como SOUTHAMPTON, talvez tivesse difi- 
culdades para vencer OPO isoladamente, no contexto do campeonato original, onde 
era impossível prever o conluio entre as entradas. Em declaração ao noticiário da Wi- 
red News, na Internet, Kendall disse que a importância dessa estratégia foi “testar al- 
gumas ideias que tínhamos sobre equipes de trabalho em sistemas de agentes em geral, 
e sua percepção do trabalho conjunto em uma equipe, como problema fundamental. O 
que foi interessante ver foi quantos colaboradores você precisa contar em uma popula- 
ção. (...) Vencemos com cerca de 20712, 


$8. Problemas com o Modelo Padrão 


Antes de ser formalizado por Robert Axelrod, o Dilema dos Prisioneiros Ite- 
rado era conhecido intuitivamente pelos economistas como “teorema popular” (folk 
theorem). O teorema popular descreve a noção partilhada pelo senso comum de que 
qualquer tipo de cooperação pode ser sustentada, em uma iteração, desde que haja a 
ameaça de punição aos transgressores. Tal punição seria mais eficiente na medida em 
que sua carga viesse se prolongar muito ao longo do tempo. O problema que surgia, 
então, era a dificuldade em se saber qual dos múltiplos equilíbrios possíveis deve ser 
recomendado para uma situação específica, já que eles podem ser mantidos de muitas 
maneiras diferentes!”. 


Pontos de equilíbrios sempre são gerados quando os resultados conjuntos ob- 
tidos em superjogos superam os ganhos de um equilíbrio existente no jogo base que 


l42 KENDALL, Gr. apud GROSSMAN, W.M. “New Tack Wins Prisoner's Dilemma”, 13 outubro de 2004. 
143 Veja KREPS. D.M. Game Theory and Economic Modelling, cap. 4, pp. 15-16. 





deu origem à iteração. Assim, no caso do Dilema dos Prisioneiros - modelo padrão -, 
qualquer ganho distribuído para ambos jogadores acima do valor da punição para de- 
serção mútua (1,1), alcançados por uma repetição de fim indeterminado, podem estar 
em equilíbrio de Nash'!”, 


Tantos equilíbrios disponíveis levam à questão sobre qual deles seria o melhor a 
ser adotado e como chegar a ele efetivamente. Por outro lado, o conhecimento do teo- 
rema popular muito antes das conclusões tiradas por Axelrod, acerca da possibilidade 
da cooperação, já previa que estratégias como OLHO POR OLHO poderiam susten- 
tar um ponto de equilíbrio ao final de várias repetições do Dilema dos Prisioneiros, 
bem como qualquer outra estratégia cooperadora que produzisse resultados acima do 
equilíbrio primário da punição mútua. O economista britânico Ken Binmore criticou 
a ênfase que se dava a esse respeito na pesquisa de Axelrod, quando este procurava 
destacar as virtudes da vitoriosa OPO ou do mecanismo do DPI, como sendo sua con- 
tribuição mais importante para a Teoria dos Jogos. Ao contrário, o que havia de rele- 
vante no trabalho de Axelrod era o enfoque “na importância da evolução na seleção de 


um equilíbrio em infinitas possibilidades de existência, como no teorema popular”"'º, 


Binmore criticou as afirmações de que a clemência, a gentileza, a retaliação e a 
clareza fossem fundamentais para o sucesso de uma determinada estratégia em parti- 
cular. Estratégias como GRIM TRIGGER (RETALIADOR PERMANENTE, RP), 
submetida no torneio inaugural pelo economista James W. Friedman (1936-2016), po- 
deriam obter bons desempenhos em ambientes mais favoráveis. O RETALIADOR 
PERMANENTE nunca é o primeiro a deserta, mas jamais volta a cooperar com quem 
fez a primeira deserção. Nesse sentido, uma vez comunicada sua forma de agir, RP é 
capaz de sustentar a cooperação satisfatoriamente, por apresentar motivos suficientes 
para que se evite sua retaliação dura, como uma “máquina do juízo final” - no filme 
Dr. Strangelove - se esta fosse anunciada a tempo de evitar o ataque nuclear. Contudo, 
é preciso destacar que sua eficácia depende que haja ao menos uma rodada prévia de 
conversação. RP não é nem um pouco clemente. 


A gentileza, por sua vez, não é um comportamento que seja inerente a estraté- 
gias evolutivas, pois máquinas que sempre cooperam camuflam comportamentos sim- 
plórios que estão sujeitos à exploração de uma simples mutação que não coopere no 
primeiro encontro. No lugar da clareza, para que um programa reconhecesse o outro 
bastaria que fosse dotado de um dispositivo, uma marca distintiva das demais, que 
permitisse uma mutação perceber a presença de uma cópia de si mesma na população, 
a fim de que ambas se envolvessem em uma cooperação. Um código tal como o que per- 
mitiu à estratégia SOUTHAMPTON estabelecer o conluio no campeonato comemora- 
tivo de 2004. Tampouco se requer que uma estratégia seja ela própria capaz de retaliar, 
aspecto que só é necessário quando a interação se desenvolve apenas entre duas partes. 
Basta somente que haja um terceiro programa que seja o vingador daquela que fora 
injuriada, para que o desertor seja punido, em relações multilaterais". 


Novos torneios mostraram que numa descrição mais realista, onde erros ocasio- 
nais e lances alternados podem ocorrer, o resultado final da iteração favorece outros 


144 Veja FIANI, R. Teoria dos Jogos, cap. 6, pp. 1609-172. 
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tipos de estratégias. Nessas circunstâncias, a forma pura de OPO obtém pontuações 
próximas às de estratégias RANDÔMICAS — em que os lances são jogados aleato- 
riamente —, sobretudo quando a probabilidade do ruído acontecer atinge 50%. Nos 
jogos simultâneos com ruído, estratégias do tipo PAVLOV, como WIN-STAY, LOSE 
-SHIFT (EM TIME QUE ESTÁ GANHANDO NÃO SE MEXE) - na qual os joga- 
dores repetem os resultados vitoriosos da última rodada (Recompensa ou Tentação) 
e mudam quando perdem (Punição e Simplório) —, são superiores à OPO, devido à 
capacidade de corrigir um erro momentâneo!”. 


De outro modo, quando os movimentos dos participantes são alternados — há 
troca de papéis —, uma variante de OPO chamada GENEROUS TIT FOR TAT(GE- 
NEROSO OLHO POR OLHO, GOPO) consegue alcançar os melhores desempenhos 
ao longo de várias gerações. Isto porque, GOPO passa a usar a probabilidade de coo- 


perar quando um lance equivocado de deserção é realizado pela outra parte!*. 


Dez anos depois de publicar The Evolution of Cooperation, Axelrod promoveu 
novos torneios de computador. Dessa vez, cobriu as situações em que o ruído interfere 
nas escolhas com uma chance inicial de 1% de provocar resultados opostos aos espera- 
dos. À seguir, avaliou também diversos níveis de ruídos a cada 10%. Em todas escalas, 
foi constatada a superioridade das variantes “generosas” de OPO frente as estratégias 
PAVLOV. A “generosidade” permitiu a correção de erros cometidos por ambos jogado- 
res em baixo nível de ruído e quando as partes não estavam adaptadas à possibilidade 
de erro. 


Outra versão de OPO, conhecida como CONTRITE TIT FOR TAT (CONTRI- 
TO OLHO POR OLHO, COPO) — que evita responder a uma deserção adversária, 
quando o próprio jogador acabara de desertar, sem intenção, na rodada anterior —, 
mostrou-se mais efetiva se o próprio jogador está adaptado ao ruído e a taxa de ocor- 
rência de equívoco é alta. Nas populações adaptadas à estratégia mista, a autocorre- 
ção dos erros é suficiente para dispor as partes a entenderem a eventualidade de modo 
adequado, restaurando a cooperação de pronto. Com isso, concluiu-se que as OPO 
modificadas permaneceram robustas nos ambientes ruidosos, em que as pessoas estão 
sujeitas a erros. As estratégias PAVLOV, por seu turno, tiveram bom desempenho ape- 
nas nos momentos em que ambos jogadores seguiam esse tipo de interação apoiada na 
manutenção de resultados positivos. Contra outros “não pavlovianos”, as pessoas fica- 
ram vulneráveis à permanente deserção (SEMPRE “D”), com o pagamento do cenário 
padrão do primeiro torneio!”. 


Apesar do otimismo de Axelrod quanto ao sucesso de estratégias reativas da fa- 
mília OPO, outros estudos têm indicado que a estratégia bem-sucedida depende intrin- 
secamente do cenário montado, da topografia da vizinhança e, sobretudo, da estraté- 
gia que o outro adotará — difícil de se prever. Como afirmam os pesquisadores Martin 


147 Às estratégias que mudam o comportamento do jogador de acordo com o resultado foram rotuladas de PAVLOV pelos 
matemáticos David P. Kraines e Vivian Kraines desde o artigo “Pavlov and Prisoner's Dilemma”, de 1989. À família de 
estratégia OP0, por sua vez, orienta-se segundo o comportamento do outro jogador. 

144 A GOPO continua cooperando sempre que o outro coopera (p=1) e deserta com a probabilidade “q” relativa à proporção 
da diferença entre R e P sobre a diferença entre Te P (g=R-P/T-P). Veja NOWAK, M.A. & SIGMUND, K. “The Alternating 
Prisioner's Dilemma”, in Journal of Theorical Biology, nº 168, p. 224. 

149 Veja WU, ] & AXELROD, R. “How to Cope with Noise in the Iterated Prisoner's Dilemma”, in Journal of 
Conflict Resolution, nº 39, pp. 1893-189 e AXELROD, R. “On Six Advances in Cooperation”, in Analyse & Kritik; 
jan. 2000. 





Andreas Nowak, Robert McCredie May e Karl Sigmund, “uma estratégia que vai bem 
22150 


num certo ambiente pode falhar miseravelmente em outros 


A Defesa de Axelrod 


A indução reversa não afeta o DPI quando este é repetido infinitamente ou de 
maneira a tornar indeterminado o fim do jogo. Entretanto, para que a indeterminação 
do final anule os efeitos da reversão das jogadas, a “sombra do futuro” deve ser a mais 
longa possível. O que vale dizer que a probabilidade de terminar a partida no próximo 
movimento seja maior do que zero. Quando as chances do jogo continuar se aproxi- 
mam de zero, o DPI volta a sentir as influências das estratégias dominantes da matriz 
básica e o valor da deserção cresce. A estratégia OPO, então, só pode obter o paga- 
mento máximo se ambos jogadores cooperarem a cada rodada. Contudo, o mesmo re- 
sultado poderia ser obtido se todos fossem cooperadores incondicionais - como propôs 
Kant, desde sua Fundamentação da Metafísica dos Costumes (1785). Sendo assim, não 
haveria uma característica particular de OPO que lhe garantisse a indicação precisa 
para atuar tendo em mente apenas as consequências de uma longa sombra do futuro. 


Para tornar mais plausível a defesa da robustez de OPO, a competição simulada 
em computadores teve de incorporar detalhes mais realistas que dessem conta da pos- 
sibilidade de erro ou confusão, na execução ou percepção de um movimento específico. 
A diferença entre lances simultâneos e alternados também teve de ser considerada, a 
fim de tornar a descrição da interação ainda mais próxima das relações reais. Tais mu- 
danças viabilizaram o aparecimento de novas estratégias que se mostraram eficientes 
em um cenário mais abrangente - como aqueles preparados por Nowak, Sigmund e 
outros pesquisadores. 


A teoria da cooperação chamou atenção de um número crescente de especialistas 
interessados na explicação mais precisa do comportamento cooperativo e das circuns- 
tâncias que o fomentam, entre seres humanos ou não. Em suma, está em jogo a tênue 
convivência entre indivíduos que buscam de imediato o melhor para si, em particular, 
e o bem do grupo, em geral, a longo prazo. Ao invés de supor uma racionalidade for- 
te para deliberações, a teoria da cooperação adotou a perspectiva de que os agentes 
procuram atuar sob regras práticas, sem efetivar um cálculo rigoroso de tudo que é 
necessário para se encontrar uma solução técnica indicada. Destarte, a cooperação, 
apoiada na reciprocidade pôde ser atribuída a pessoas, nações e organismos biológicos, 
em geral. Tudo porque a simplicidade do Dilema dos Prisioneiros assim o permitia. 
Graças ao DPI e suas variantes, as simulações em computadores puderam observar a 
eficiência das estratégias nos ambientes mais variados, incluindo os modelos biológicos 
evolutivos. 


As diferenças entre cenários onde movimentos eram efetuados ora simultanea- 
mente, ora alternadamente, não foram, na interpretação de Axelrod, suficientes para 
refutar cabalmente as conclusões básicas da teoria da cooperação por reciprocidade, 
porque mantiveram os efeitos favoráveis da presença da sombra do futuro sobre a 
expectativa de ganhos possíveis e a dependência da compreensão que a escolha das 
estratégias depende do que se espera que o outro faça. 


150 — NOWAR, M. E., MAY, R. & SIGMUND, K. “The Arithmetics of Mutual Help”, in Scientific American, jun. 
1995, p. 78. 








Se é possível que o outro jogador seja suficientemente respon- 
sável, e os pagamentos e sombra do futuro são suficientemente 
favoráveis, recomendar a estratégia recíproca ainda parece ser 


conselho robusto (AXELROD, R. “On Six Advances in Coope- 
ration Theory”, p. 18). 


Outros fatores, como a consideração da reputação, racionalidade, adaptação e 
inveja, revelaram o papel que os detalhes podem exercer em uma rede social ou quan- 
do se mostra a oportunidade de abandonar a interação. A troca de informação entre 
os participantes sobre seu comportamento passado permite que a reputação seja re- 
conhecida, promovendo a cooperação mesmo se os jogadores nunca se encontraram 
antes, caso um deles seja um RETALIADOR PERMANENTE, por exemplo. Uma 
estrutura social adequada pode manter a cooperação sustentada na reputação, quan- 
do esta é de conhecimento público". 


Em resposta às críticas quanto à clareza, como propriedade de uma estratégia 
vitoriosa, que sustentam que para uma mutação ou adaptação aprender um compor- 
tamento recíproco, basta que seja capaz de aprender a regra por si mesma, Axelrod 
pondera que a mistura das escolhas de ações pode ser difícil de ser compreendida, ao 
se enfrentar várias estratégias ao mesmo tempo. Sobretudo quando se tem também 
de avaliar as consequências de cada um empiricamente. Para serem bem-sucedidos, 
tais tipos de interações precisam levar em conta o conjunto de estratégias envolvidas, 
identificando aquelas cópias de si mesmas que se reproduzem corretamente, bem como 
suas principais mutações. Em socorro a essas dificuldades, uma compreensão racional 
mínima procura cooperar sempre em função do resultado satisfatório, depois de se 
fazer a deliberação correspondente! 


Isso conduz à discussão sobre a justificação de um comportamento que pode ser 
afetado, em sistemas neurológicos mais avançados, pelo sentimento de inveja, enten- 
dida como um pagamento tão alto como o do outro jogador, ou o não desejo de ganha 
menos, ou ainda não aceitar que meios injustos permitam o favorecimento do desem- 
penho do adversário. Tal sentimento poderia estar na base de uma intuição primária 
de justiça. Em ambientes sujeito a ruído, que podem provocar uma resposta equivo- 
cada ao comportamento do outro, OPO poderia ser transformada em uma estratégia 
INVEJOSA MODERADA - cooperar se ganha uma vantagem extra -, sem deixar de 
ser robusta, desde que mantenha a reciprocidade entre os jogadores depois de uma 
eventual punição por esse ganho “indevido”. Efetivamente, qualquer que seja a defi- 
nição de inveja que se queira atribuir aos jogadores para fornecer maior nitidez psico- 
lógica a esses replicantes, essa não parece ser uma legítima justificação para restringir 
as escolhas dos participantes na interação, sendo apenas uma interpretação relativa à 
cultura em que se está inserida. Na prática, OPO não se mostra como uma estratégia 
invejosa, sobretudo quando arrependida para ganhos não merecidos, em um cenário 
ruidoso na estratégia derivada COPO!&, 


Por fim, uma alternativa que evite a atuação de oportunistas é modelada em 
Jogos que permitem o abandono da interação se o relacionamento se mostrar insatis- 
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fatório para uma das partes. Isso pode ocorrer quando a cooperação é repentinamente 
rompida por uma deserção, ocasião em que o jogador afetado imediatamente sai da 
partida. A possibilidade de sair só surge, então, quando o outro não coopera. O efeito 
de saída é avaliado adequadamente no contexto em que estão envolvidas mutações 
e, por conseguinte, quando se está levando em conta a adaptação ao meio ambiente. 
Vale dizer que isso implica em investigar a população de estratégias atuantes, a fim 
de saber qual produz os melhores resultados, segundo um histórico de confiabilidade, 
uma vez que o conjunto inicial influencia a comparação correta dos diversos cenários 
montados. À saída rápida de uma deserção pode diminuir em muito os prejuízos de 
estratégias gentis e aumentar as perdas das más cooperadoras!”, 


Embora a teoria da cooperação tenha apresentado alguma sensibilidade a mu- 
danças nos ambientes onde as hipóteses originais foram lançadas, de um modo geral, 
ela se mostrou apta para analisar a emergência da cooperação nos mais diversos tipos 
de simulações. Enfaticamente, percebeu-se que a conduta cooperativa pode surgir nas 
mais diferentes circunstâncias. Além de OPO, muitas outras estratégias cooperadoras 
foram apontadas como válidas, desde que a rodada final estivesse indeterminada em 
um horizonte distante e as estratégias estivessem também prontas a se corrigirem, 
quando atingidas por desafios de comportamentos alternativos. Restrições à raciona- 
lidade dos agentes, que implementam os programas determinados nos torneios, abrem 
espaço à especulações ou futura investigação, sobre o papel da escolha racional na 
formulação de algoritmos mais refinados que façam a distinção precisa das condições 
mais favoráveis à cooperação. Conforme Robert Hoffmann indica em sua defesa da 
teoria da cooperação, a capacidade de aprendizagem durante o processo interativo 
pode ser a melhor explicação para saber como tais relações estratégicas ocorrem na 
natureza!» 


$9. Estratégias Vitoriosas nas Variantes do Modelo Padrão 


Depois que Axelrod popularizou a simulação em computadores como método 
de avaliação privilegiado das condições em que estratégias cooperadoras poderiam ser 
bem-sucedidas, uma série de variações dos parâmetros dos campeonatos originais foi 
testada com o intuito de examinar a validade de suas hipóteses iniciais. Para cada 
novo modelo, apareceram novas estratégias vitoriosas que se mostravam robustas a 
invasões, enquanto corrigiam algumas vulnerabilidades percebidas nas versões ante- 
riores. Pequenas mudanças na constituição primária do Dilema dos Prisioneiros Ite- 
rado poderiam favorecer linhas de ação que de outra forma não poderiam subsistir 
plenamente. 


Uma competição evolutiva do Dilema dos Prisioneiros, em que as partes ape- 
nas podem ou cooperar ou desertar entre si, isto é reagem apenas de uma maneira 
determinada, sem ponderar os lances com uma taxa de probabilidade definida, mas 
respeitando apenas esses dois estágios de escolha, permitiu que algoritmos RP domi- 
nassem a maioria da população remanescente, no final de um jogo evolutivo. Entre 26 
participantes que concorreram nestas condições, 67% da população passou a ser com- 
posta por RETALIADORES PERMANENTES, ressalvado o cenário em que haveria 
a possibilidade de mutação entre as sucessivas gerações. Quando esta mutação atingia 
1%, a vantagem de RP caia para faixa dos 50% !*º. 
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A estratégia RP é inclemente. Jamais coopera depois do outro jogador ter de- 
sertado primeiro no movimento anterior. Também é RP extremamente sensível ao 
erro. Qualquer deserção equivocada pode levar a uma punição máxima por parte do 
retaliador. Sem embargo, nos torneios de Axelrod, onde não havia possibilidade de 
erro no desempenho dos algoritmos, RP obteve a sétima colocação entre as 14 que par- 
ticiparam da primeira fase e a 52º posição entre as 63 concorrentes do segundo turno. 
Como o próprio Axelrod destacou, das 39 estratégias gentis - aquelas que começam 
cooperando - do segundo campeonato, RP ficou com o pior lugar entre elas. Para que 
RP obtenha êxito em um contexto verossímil, faz-se necessário que seu agente seja 
capaz de comunicar corretamente a ameaça de uma severa retaliação, caso venha ser 
explorado por um desertor desavisado. Só assim um RP passa a ser um incentivo má- 
ximo para manutenção da cooperação. Contudo, qualquer desatenção pode ser fatal. 


Apesar das dificuldades de se manter a cooperação com RPs, sua resistência em 
um ambiente evolutivo explica-se pela eficiência de cumprir suas ameaças ou promes- 
sas de lealdade. Um comportamento que transparece entre aqueles que se empenham 
passionalmente pela palavra empenhada. Punições severas surgem como preço de se 
tornarem verazes os compromissos assumidos. Nos seres vivos, emoções fortes, como 
a cólera, a ira ou fúria, emergem como modo de pela intimidação ser levado a sério. 
Quanto mais incontrolável e intolerante a erros, maiores as chances de serem críveis 
suas ameaças!”. 


Na ação política, isso explica, mas não justifica atos extremados de terroristas 
suicidas. Na natureza, espécies RPs abrem espaço para a sobrevivência de organis- 
mos que se aproveitam da “fama de mau” daqueles de quem mimetizam a aparência 
agressiva ou os seus padrões de cores. Desta artimanha são exemplos espécies como a 
cobra-coral-falsa (Lampropeltis doliata), nativa do sudeste estadunidense, que usufrui 
da proteção extra por reproduzir as mesmas formas da verdadeira cobra coral (Mi- 
crurus nigrocinctus), que é uma espécie venenosa distinta, e a borboleta Caligo beltrao 
(popular “corujão”), encontrada no sudeste brasileiro, cujo macho ostenta os olhos de 
uma sisuda coruja nas suas asas posteriores, afastando os predadores distraídos. 


Fatores Psicológicos 


Outro algoritmo a revelar aspectos psicológicos importantes adquiridos na evo- 
lução da cooperação foi vencedor de um campeonato alternativo realizado pelos biólo- 
gos matemáticos Martin A. Nowak e Karl Sigmund, na época em que o primeiro ainda 
estava na Universidade Oxford e o segundo na Universidade de Viena, em 1993. Na 
variante simultânea do DPI sujeita a erro, que eles montaram, a estratégia chamada 
WIN-STAY, LOSE SHIFT (EM TIME QUE ESTÁ GANHANDO NÃO SE MEXE) 
foi a vencedora. Historicamente, essa estratégia havia sido sugerida pela primeira vez 
por Anatol Rapoport e Albert M. Chammah (1928-2008) no texto intitulado Prisoner”s 
Dilemma, de 1965, com o estranho nome de SIMPLETON (TOLO). Mais tarde (1990) 
esse mesmo programa foi descrito por Jeffrey Scot Banks (1958-2000) e Rangarajan K. 
Sundaram como TAT-FOR-TIT (AQUILO POR ISTO, uma inversão de TIT-FOR- 
TAT), designação preferida por Binmore, devido ao comportamento semelhante ao de 
OPO na sua atuação original, mas que o inverte após uma deserção!*. 


with Noise Played by Multi-State Automata”, p. 11. 
151 Veja PINKER, St. Como a Mente Funciona, cap. 6, pp. 4286-438. 
158 Veja BINMORE, K. “Review: The Complexity of Cooperation”, p. 6. 


Figura 3.3 - Jogo Simultâneo com Ruído (erro) 
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d = deserção equivocada c = cooperação equivocada 


Além desses nomes, a linha de ação que mantém o mesmo estado quando está 





ganhando e muda quando perde foi também denominada PAVLOV. Um agente pavlo- 
viano permanece no seu movimento inicial se seu pagamento corresponder aos valores 
da tentação (T) ou da recompensa (R), trocando de opção toda vez que receba apenas 
a punição (P) ou ganho simplório (S). Para os matemáticos David P. Kraines e Vivian 
Y. Kraines, que renomearam a antiga SIMPLETON como uma homenagem ao histó- 
rico fisiologista russo Ivan Petrovich Pavlov (1849-1936), esse tipo de comportamento 
na natureza pode ser atribuído aos peixes-espinhos (Gasterosteus acaleatus), quando 
estes inspecionam um território em busca de um predador'”. Em um DPI simultâneo 
com erro, pode ocorrer a algumas estratégias o efeito de “eco”, como a OPO, caso, de- 
pois de uma primeira deserção equivocada, o segundo jogador passe a retaliar e, após 
retornar à cooperação, em respostas defasadas aos comandos do outro. Pode acontecer 
ainda uma sequência de mútua deserção e, em seguida a um novo equívoco, ser refeito 
a repetição do “eco” com a fase invertida, que só depois de um outro movimento erra- 
do poderá reinstalar a cooperação (figura 3.3). 


Ao invés de persistirem em uma sucessão de diversos erros para estabelecer a co- 
operação, dois jogadores “pavlovianos” poderiam recuperá-la rapidamente sem maio- 
res dificuldades, graças à capacidade desse programa superar possíveis enganos nas 
tomadas de decisão. Essa habilidade de recuperar o estágio inicial da interação em 
poucos movimentos demonstrou que PAVLOV era mais robusta em ambientes ruido- 
sos do que OPO (figura 3.4). 


Figura 3.4 - Jogo Simultâneo com Ruído (erro) 
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Depois de saber desses resultados, Axelrod resolveu refazer a disputa de seu se- 
gundo torneio. Dessa vez, com a possibilidade de 1% de uma decisão ter sido tomada 
equivocadamente. A RP é absolutamente desastrosa nesse tipo de ambiente. Todavia, 
a variante generosa de OPO (GOPO) poderia sair-se melhor do que qualquer uma das 
63 instruções submetidas no segundo campeonato. GOPO seria uma versão de OLHO 
POR OLHO que cooperaria 10% das vezes em que deveria agir desertando em função 
da atitude não cooperativa da outra parte. “Isso previne que um simples erro ecoe 


159 Em 1987, Manfred Milinski associou o comportamento do peixe-espinho ao da estratégia OPO (veja MILINSKI, M. ““Tit 
for Tat in Sticklebacks and the Evolution of Cooperation”, entretanto, já admitia rever suas conclusões, em 1993, 
considerando PAVLOV a maneira mais apropriada de descrever suas reações diante de um possível rival (veja MILINSKI, M. 
“Cooperation Wins and Stays”). 








indefinidamente” - afirmou Axelrod, ao lado do chinês Jianzhong Wu!º. 


De fato, na variação alternada do DPI, realizada por Nowak e Sigmund, GOPO 
conseguiu regenerar a cooperação, a longo prazo, de uma forma mais eficaz do que 
PAVLOV, nas mesmas condições. Uma das conclusões que foram tiradas dessa expe- 
riência foi que, por observar apenas os resultados obtidos, PAVLOV estaria mais apta 
a reagir em circunstâncias onde não fosse necessária a percepção precisa do jogo feita 
pelo adversário, que ignoraria suas intenções. Ao passo que, estratégias miméticas da 
família OPO conseguem se defender da exploração de quem nunca coopera, enquanto 
PAVLOVY ficaria alternando suas ações entre Pe S. Prestar atenção no que o outro faz 
é a chance de atingir a melhor solução estratégica no cenário ruidoso de troca de papéis 
entre os jogadores. Nesse sentido, enquanto OPO fora a estratégia mais eficaz para 
emergência da cooperação, uma vez estabelecida as condições para manutenção desta 
através da seleção natural, a vertente GOPO seria a mais realista e robusta a invasões 
de mutantes ou ações equivocadas!*!, 


Junto à estratégia generosa de OPO, uma linha de ação chamada CONTRITO 
OLHO POR OLHO (COPO) pode ser considerada bem-sucedida em ambientes rui- 
dosos. COPO atua semelhante a OPO, mas procura evitar responder uma deserção 
da outra parte, depois que o próprio jogador ter desertado equivocadamente na roda- 
da anterior. Procedendo assim, do mesmo modo que GOPO é tolerante com os erros 
cometidos pelos adversários, COPO mostra arrependimento pelos próprios enganos. 
Deste modo, rapidamente as estratégias variantes podem restabelecer a cooperação 
depois de lances confusos de ambas as partes. COPO começa sempre cooperando e se 
mantém satisfeito com a cooperação até que haja uma deserção. Se esta foi provocada 
pela outra parte, passa a retaliar até que o retorno à cooperação o deixe novamente 
satisfeito. Porém, quando a deserção foi praticada pelo próprio jogador, acontece o 
arrependimento que admite uma retaliação adversária, que o obriga a cooperar em 
seguida. 


Enquanto GOPO produz um comportamento cooperativo satisfatório quando a 
taxa de ruído vai até 1%, COPO consegue maior eficiência em níveis maiores do que 
este. Na versão ecológica da segunda fase do torneio de Axelrod com ruído, COPO 
atingiu a liderança entre as seis melhores estratégias daquele campeonato, após 2000 
gerações. Contudo, em determinados confrontos, como os contra OPO original, essa 
estratégia é vulnerável ao efeito de eco, quando aquela deserta por acidente. De acordo 
com Axelrod, apenas um novo engano poderia reparar a cooperação inicial. Tal ocorre 
porque COPO é eficaz na reparação de seus próprios erros, mas não os do oponente, 
pois neste caso continua reagindo da mesma forma que OPO contra a exploração do 


adversário. COPO só é eficiente contra algoritmos adaptados à situação de ruído!?. 


A reação de quem aplica COPO é identificada com a de quem opera a linha de 
ação do INVEJOSO MODERADO (IM), quando este ganha uma vantagem indevida. 
Na ausência de ruído, IM joga como se fosse OPO. Do contrário, não aceita que o outro 
jogador deserte mais do que ele mesmo. Destarte, um jogador invejoso que fosse capaz 
de se arrepender de ter ganhos excessivos poderia evitar a exploração de desertores, 


160 WU, ]. & AXELROD, R. “How to Cope with Noise in the Iterated Prisoner's Dilemma”, p.2. 
161 Veja NOWAK, M. & SIGMUND, K. “The Alternant Prisoner's Dilemma”, 8 1, p. 226. 
l62 Veja WU, ]. & AXELROD, R. Op. cit. pp. 6 e 7. 





ao mesmo tempo em que se mostra aberto a cooperação, depois de uma punição mo- 


tivada. 


À medida que o refinamento da descrição do Dilema dos Prisioneiros repetido foi 
se aproximando de um modelo mais realista da interação humana, novas competições 
foram sendo promovidas, a fim de reproduzir as condições em que a cooperação pode 
surgir em um ambiente típico da seleção natural darwiniana. David e Vivian Kraines, 
em “Protocols for Cooperation” (2001), elaboraram uma disputa em torno de um Di- 
lema dos Prisioneiros Alternado, ou sequencial, onde uma nova estratégia chamada 
TOUGH LOVE (AMOR BRUTO, AB) manteve a cooperação estável ao punir o mau 


comportamento e esquecer rapidamente a reincidência. 


No cenário evolutivo, no qual os agentes eram capazes de recordar os quatro 
resultados anteriores, as características tolerantes de AMOR BRUTO foram cruciais 
para gerarem cooperação mútua com uma sequência de movimentos trocados aleato- 
riamente. Nesse contexto, a cooperação não surge do altruísmo, mas da habilidade de 
lembrança dos resultados de alguns encontros passados. Assim, muitos grupos A Bs 
podem ser formados, ficando sua sustentação garantida pela distinção clara de certos 
protocolos e regras “culturais”. Ou seja, membros de um grupo, que tenham seus pró- 
prios hábitos e procedimentos, seriam bem-sucedidos se permanecessem no seio deste, 
ao invés de visitar outras associações. Kraines & Kraines concluem que essa “diferença 
cultural entre clãs é estável evolutivamente com respeito a outros clãs”'º. Quer dizer, 
saber distinguir adequadamente aqueles que fazem parte de seu grupo é uma condição 
prioritária para manter a estabilidade de uma estratégia frente a concorrente. 


A estratégia memoriosa de um Dilema dos Prisioneiros Alternado, AB, atua 
como um cooperador recíproco que pune deserções imotivadas; contritamente coope- 
rando depois de ter sido punido por uma deserção que tenha cometido; e tolerando um 
oponente arrependido. Depois de uma deserção acidental, AB coopera sem problemas 
com o adversário. Comportando-se dessa maneira, AB evita os círculos viciosos de 
deserção com seus pares, não explora agentes altruístas (SEMPRE C), retorna rapida- 
mente a uma cooperação com os outros após uma série de erros confusos. É, portanto, 
um parâmetro apropriado para uma estratégia evolucionária estável (EEE), com uma 
trajetória com pequenas mudanças aleatórias no nível de ruído, estágios, quantidade 
inicial de agentes e ganhos esperados variáveis". 


Não obstante, quando a memória dos participantes desse tipo de torneio seletivo 
chegava a quatro decisões anteriores, foi detectado que apenas 44% dos agentes envol- 
vidos se tornaram cooperadores. 


A maioria da população nunca se envolve com cooperação mú- 
tua nesse modelo. Ao invés disso ser uma falha do modelo, pode 
ser um reflexo acurado da evolução no mundo real. Em poucas 
espécies, indivíduos ordinariamente cooperam com outros, ex- 
ceto pelos relativamente próximos. As espécies que desenvol- 
vem cooperação recíproca tendem a ser as mais inteligentes 
(grande memória), mas mesmo entre espécies altamente inteli- 
gentes, comportamento cooperativo não é, em geral, resultado 


163 — KRAEINES, D. & KREINES, V. “Protocols for Cooperation”, 3 1, p. 3. 
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evolucionário. Embora padrões de comportamento cooperati- 
vos sejam geralmente mantidos entre leões, não há entre tigres. 
Ao invés de batalhas tipo perda-perda, muitas espécies que 
tomaram a trajetória evolucionária até SEMPRE D também 
aprenderam a evitar interações (...) com outras espécies. Tigres 
tendem à vida solitária e evitar um longo número de pagamen- 
tos perda-perda (KRAINES, D.& KRAINES, V. Protocols for 
Cooperation, 8 18, p. 28). 


Nas sociedades humanas, os confrontos eventuais têm sido superados por uma 
série de normas e rituais que visam reestabelecer a harmonia na sociedade, depois 
que algum ato veio a prejudicar a cooperação. Tais aspectos do comportamento social 
parecem corroborar a afirmação de que instituições surgiram ao longo de todo um 
aprendizado obtido não apenas no processo seletivo natural, nos moldes darwinianos, 
mas da diferenciação cultural que emerge nos grupos de estratégias que não se esquece 
facilmente do passado, em um modelo de Dilema dos Prisioneiros Alternados. 


Por razões genéticas e culturais, sentimos prazer depois de fa- 
zer uma boa ação. Também ressentimos de quem tira vanta- 
gem de nossa boa vontade e retaliamos ou mantemos um sis- 
tema judicial para retaliar por nós. Ao passo que tendemos a 
esquecer aqueles que se desculpam e se arrependem. A emoção 
da culpa nos detém de explorar e logo retornamos a cooperar. 
Esses sentimentos correspondem aos que poderiam dirigir um 


agente AMOR BRUTO. Nossas respostas emocionais podem 


bem-estar envolvidas em parte por obter interações típicas de 
um Dilema dos Prisioneiros (KRAINES, D. & KRAINES, V. 
Op. cit., 8 18, p. 29). 








Capítulo 4 
Pegadas da Centopeia 


D a mesma forma que os jogos de soma zero não eram suficientes para descreverem 
todo tipo de interação entre dois agentes racionais, o modelo padrão do Dilema 
dos Prisioneiros Iterado apresentava muitas limitações em sua representação das re- 
lações sociais ou biológicas, em um nível mais profundo. Acrescentar elementos pre- 
sentes em interações reais, que por simplicidade foram inicialmente omitidos, tornou 
a simulação mais precisa, apesar de sua complexidade. Afinal, ruídos, equívocos, troca 
de papéis e evolução da posição dos agentes são frequentes nas relações observadas no 
dia a dia dos organismos vivos. 


Durante o período da Guerra Fria (1945-1989), não raro, enganos eram come- 
tidos sob a suspeita de espionagem por partes dos dois blocos políticos rivais - sovié- 
ticos e capitalistas. Lamentavelmente, alguns desses erros eram fatais. Houve casos 
de aviões de passageiros terem sido abatidos por sobrevoarem próximos à fronteira 
das regiões mais conflitantes. Em 1983, 269 pessoas a bordo de um aparelho de uma 
empresa aérea sul-coreana foram sacrificados em nome da segurança militar e suspeita 
de espionagem, quando o avião invadiu o espaço aéreo da extinta União Soviética. Er- 
ros são uma constante na vida de seres racionais imperfeitos. Apenas ignorá-los pode 
custar mais caro do que tentar aprender com eles. Nesse sentido, elaborar simulações 
que consideram a probabilidade de erros e estratégias capazes de aprender com eles, 
recuperando rapidamente a cooperação, ajuda a depurar a avaliação das condições que 


permitem a manutenção duradoura e bem-sucedida de um empreendimento comum!*. 


Jogos simultâneos, com ou sem erro, raramente acontecem no mundo real. Na 
maioria das vezes, as ações são efetuadas em resposta a uma atitude anterior execu- 
ta. Alternar a sequência de ações entre agentes permite descrever as relações sociais 
de forma mais realista. Tendo em mente essas observações triviais, desde que Martin 
Nowak e Karl Sigmund propuseram modelos de Dilema dos Prisioneiros alternativos, 
várias estratégias factíveis puderam ser moldadas. Isso proporcionou uma refinada 
descrição dos comportamentos cooperadores através de estratégias mais sofisticadas. 


165 Veja WU, ]. AXELROD, R. “How to Cope with Noise in the Iterated Prisoner's Dilemma”, p.l. 








Métodos de Simulação 


Para poder incluir alternância de movimentos e a probabilidade de erros na repe- 
tição do Dilema dos Prisioneiros, uma forma mais precisa e compacta de apresentar os 
resultados e estratégias formulados foi proposta. À partir da matriz básica do Dilema 
dos Prisioneiros e as condições de relacionar os ganhos (T>R>P>Se2R>T+S), 
os valores do modelo padrão de Axelrod, T=5, R=3, P=1, S=0, foram alterados para 
atender a relação 


D(c<a)e 
2)(c-a>b-d); 


6699 bo 99 
c 


onde é igual ao pagamento que o jogador recebe quando sua opção é desertar; “a 


significa o que ele recebe quando coopera; “b” é o resultado do outro jogador ao coope- 
rar e “d” quando deserta. Logo, para o líder - o primeiro a jogar -, em uma só rodada, 
desertar é melhor que cooperar, enquanto para o outro, trivialmente a cooperação do 
líder é melhor que a deserção. Além disso, a diferença entre a deserção e a cooperação 
para o líder é menor do que o ganho do oponente com sua cooperação em relação à 
deserção. 

Por conta dessas condições em que a simetria entre os jogadores é quebrada no 
Dilema dos Prisioneiros alternado, enquanto ambos jogam “C”, a recompensa será “a” 
mais “b” (R = a + b); um “D” mútuo equivale a “c” mais “d” (P = c + d); mas seo líder 

66,199 


coopera e o outro deserta, aquele receberá “a” pela sua cooperação e “d” pela deserção 
do outro (S = a + d); finalmente o desertor do cooperador recebe 


66.99 
c 


e “b” ao qual é 
tentado (T = c + b). O que vale dizer que existe uma equação em que 


T+S=P+R. 


Entretanto, essa igualdade não é satisfeita pela distribuição de valores de Axelrod, que 
leva ao seguinte resultado: 


o +0=1+83. 


Contudo, os ganhos T=4; R=3; P=1 e S=0 satisfazem àquela equação!. Com 
essa nova tabela pronta, as decisões dos agentes foram restritas a informações de umas 
poucas rodadas, a fim de tornar difusa a escolha entre “C” e “D” sobre as probabilida- 
des das interações baseadas em uma memória curta. Assim, os erros de avaliação das 
chances de uma determinada escolha poderiam ser considerados na aplicação de uma 
regra!?”, 


Em seguida, estabeleceu-se que os resultados R, S, T, e P de um jogador, na or- 
8 q Jos 
dem em que aparecem na matriz, desde as opções “C” ou “D”, seriam numerados res- 
pectivamente como 1, 2, 3 e 4, em um conjunto de ações para um participante, onde p, 
é igual ao resultado da recompensa para ambos na jogada anterior. Então, a estratégia 
p=(p',pP'»P'» Pp”, de um jogador passa a ser descrita por meio das escolhas entre 0 e 
1, para a probabilidade de cooperar. Desse modo, por exemplo, OPO pode ser instruída 
pela regra (1, 0, 1, 0) que manda cooperar sempre que o outro coopera (1) e desertar 
(0), quando tiver recebido “S” ou “P” na rodada anterior. Nos casos extremos, (0, 0,0, 


166 — T=3; R=2; P=1 e $=0, que foram utilizadas na figura 1.10 do DP do capítulo 1, também correspondem a essas condições 
iniciais. 
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0) equivale a SEMPRE D e (1, 1, 1, 1), SEMPRE C. Já RANDÔMICA é a estratégia 
(0.5, 0.5, 0.5, 0.5), ou sempre jogar “cara ou coroa” para saber o que fará a cada lance. 
PAVLOVY, a estratégia vencedora na simulação simultânea com erro - ou ruído -, está 
contida em (1, 0,0, 1), isto é, manter a cooperação depois de receber “R” e a deserção 
com “T”; trocando de posição depois de ganhar “S” e “P”. 


No modelo alternado de Nowak e Sigmund, Generosa OPO (GOPO) foi vitoriosa 
quando variava suas ações para punição em 2/3 das vezes (1, 0, 1, 2/3). Em sua versão 
pura, ou determinista, GOPO também é conhecido por FIRM BUT EATR (FIRME 
MAS JUSTO, FMJ) e joga como uma tolerante versão de OPO (1, 0, 1, 1). De fato, 
FIRME MAS JUSTO é um híbrido de OPO e PAVLOVY. 


Lembrar o Passado 


David Kraines e Vivian Kraines consideram que o Dilema dos Prisioneiros Alter- 
nado (DPA) com probabilidade de erro é a representação mais fidedigna dos encontros 
entre dois agentes com interesses parcialmente conflitantes. Para ampliar tal simu- 
lação a seres inteligentes, incluíram como artifício a possibilidade de se recordar até 
quatro resultados anteriores. Agentes com memória de quatro lances prévios podem 
lembrar de duas escolhas atrás feitas por si e seu oponente. De tal modo, que a seleção 


das estratégias poderia ser moldada como uma evolução darwiniana!º. 


Na maior parte das relações entre indivíduos, as decisões e suas respectivas lições 
são encaradas alternadamente. À execução sequencial do Dilema é exemplificada por 
vários modelos de interações sociais como a retribuição de trabalho entre fazendeiros 
que colhem suas safras em temporadas defasadas. Ter uma memória que considera 
as decisões passadas capacita os agentes a recordarem os resultados dos últimos en- 
contros ocorridos entre as partes. Cada uma destas tem de escolher entre cooperar ou 
desertar alternadamente, durante uma longa série de movimentos indefinidos. Depois 
que o segundo jogador realizar sua ação, ambos recebem o ganho relativo ao resultado 
conjunto, como na figura 4.1"ºº. 


Figura 4.1 - DPA 
Decisão 1 2 3 
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Resultados 
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As séries de deliberações executadas de acordo com as escolhas anteriores do 
outro jogador podem variar, como uma estratégia mista, a uma taxa de probabilidade 
relativa à sequência ocorrida, enquanto agentes determinados cooperam ou desertam 


168 Veja KRAINES, D & KRAINES, V. “Protocols for Cooperation”, 8 |, p. 1. 
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com probabilidade O ou 1. A confusão ou erro acontecem entre agentes falíveis, que 
não são capazes de cooperar ou desertar com segurança absoluta e precisam, então, 
recorrer a cálculos probabilísticos para terem reveladas a frequência da cooperação!”. 


Os pagamentos de cada jogador também variam conforme a probabilidade de 
cada um cooperar e obedecem a um estado de equilíbrio de probabilidade, ou cadeia 
de Markov, que apresenta uma matriz com os possíveis resultados para cada tipo de 


estratégia mista!” 


« O modelo adaptativo dinâmico utilizado partiu de uma população 
inicial distribuída uniformemente que pratica uma mesma estratégia com grande nú- 
mero de descendentes com uma pequena variação em relação a seus pais. Esses suces- 
sores sobrevivem e passam suas características principais à próxima geração à medida 


que conseguem obter o maior ganho de sobrevivência. 


De um a quatro passos, a capacidade de memorização foi testada no DPA de 
Kraines e Kraines. À partir do terceiro nível de memória, a estratégia tolerante AMOR 
BRUTO aparece entre as famílias mais bens sucedidas. AB é uma combinação de 
PAVLOV com OPO. Na verdade, trata-se de uma variedade estocástica de GOPO, que 
toma decisões variando conforme o padrão (1 - É, E, 1 - E, 1 - E), onde É representa a 
possibilidade de erro entre0e 1 (0< E < 1). Intuitivamente, é um cooperador recíproco 
que pune deserções imotivadas e esquece as deserções de um oponente contrito. 
Permanece firme na punição, quando ao menos três lances anteriores não permitem 
identificar quem começou a deserção. Porém, ao contrário de PAVLOV não é capaz 
de explorar a generosidade do outro jogador, caso venha equivocadamente desertar, 
agindo sem remorso em favor da retomada da cooperação!?. 


Nas condições de aleatoriedade de DPA, as características que favoreceram a 
procriação foram a aptidão para cooperar com estratégias que são idênticas consigo, a 
capacidade de explorar cooperadores incondicionais e de resistir à exploração de quem 
sempre deserta. Assim, a memória ampla de jogadores inteligentes permitiria o reco- 
nhecimento de seus semelhantes, com os quais cooperariam, atuando como SEMPRE 
C, enquanto rechaçam todos exploradores contumazes. Memórias de quatro lances 
atrás, proporcionam a um cenário com 1000 agentes iniciais, ao final de 4000 gerações, 
com É = 0.01, comportar a formação de grupos de estratégias que usavam protocolos e 
convenções próprias para restabelecerem a cooperação depois de uma deserção errada. 
A diferença de protocolos levou cada grupo a sustentar ganhos altos entre aqueles que 
cooperam com seus pares do que com os de fora do grupo, por não agirem da mesma 
forma. Destarte, os grupos se tornaram resistentes a invasores, sendo AB uma das es- 
170 Veja KRAINES, D. & KRAINES, V. Idem, 6 3, pp. 4-6. 


lt KRAINES, D. & KRAINES, V. Ibidem, 8 5, p. 8 e NOWAK, M. & SIGMUND, K. Op. cit., à 3, p. 221 utilizam a seguinte 
matriz para representar os possíveis pagamentos de um jogador que usa a estratégia p, contra um outro que use p': 


PaP'; pil(1 - p':) (1 -p)p': (1 - p;)(1 — p':) 
P2p's  p2(1-p's) (1-p>)p': (1-p>)(1 - p's) 
PsP'>  Ps(1-p'>) (1-ps5)p'> (1-ps)1-p') 
PaP's  Pa(1-p'4) (1-pap's (1-pa1-p's) 
17 Veja KRAINES, D. & KRAINES, V. Ibidem, $ 8, p. 14, mas antes destes NOWAK, M. & SIGMUND, K. Op. cit. 8 4, p. 


222 já adiantavam, sem nomear AB, que tal padrão com baixo nível de ruído, em geral, sempre surge como vencedor em uma 
corrida evolucionária. 





tratégias mais efetivas, por repelir os SEMPRE D e refazer a cooperação rapidamente 
com suas cópias, depois de movimentos defeituosos!?. 


Embora os jogadores com memória de até quatro lances tivessem apresentado 
resultados cooperativos avançados, alguns tipos de estratégias evoluíam para estra- 
tégias generosas ou caíam na pura deserção, como aqueles que partiam do algoritmo 
PAVLOV. Nem sempre ter grande memória significou ser mais vantajoso para coo- 
peração. Com duas memórias apenas, 30% da população resultante se envolveu em 
cooperação, enquanto o dobro de memória avançou a cooperação apenas para 44%. 
A maioria dos sobreviventes, entretanto, não participava em nenhuma cooperação no 
final da simulação DPA realizada por David e Vivian Kraines!”, 


Modelando a Evolução 


As tentativas de imitar a evolução no computador não são exclusivas da teoria 
dos jogos ou da cooperação. Paralelo ao desenvolvimento dessas pesquisas, teóricos do 
caos e dos sistemas dinâmicos, na matemática e na física, desde os anos 1970, vinham 
tentando descobrir um algoritmo que reproduzisse em máquinas a diversidade de or- 
ganismos presentes na natureza. O próprio John von Neumann - que, além da teoria 
dos jogos, foi um dos personagens principais do desenvolvimento dos computadores e 
da Inteligência Artificial - já havia lançado as bases para a criação de “vírus” eletrôni- 
cos, pequenos programas que eram capazes de reprodução autônoma. Von Neumann, 
na década dos 1950, aplicou o conceito dos autômatos celulares, cujo modelo havia sido 
desenvolvido pelo seu colega matemático, o polonês Stanislaw Marcin Ulam (1909- 
1934), que pretendia criar um mecanismo automático que simulasse a criatividade da 
evolução! 


Em termos da teoria dos caos, esses autômatos celulares formam um sistema 
dinâmico complexo que se multiplica em uma rede quadriculada, como um infinito ta- 
buleiro de xadrez. Cada quadrado reage com aqueles que lhe são adjacentes, seguindo 
uma regra simples. Os autômatos progridem em vários estados sucessórios, conforme o 
comportamento de suas casas vizinhas e os seus próprios comandos internos. Ao longo 
do tempo, toda rede modifica sua configuração em consequência da mudança cons- 
tante de estado de suas células. As informações contidas em cada autômato celular 
permitem a criação de organismos complexos e dinâmicos que avançam por toda rede 
e revelam uma estrutura global em parte dependente das regras de cada célula, mas 
que não pode ser estritamente determinada por estas!”. 


Regras diferentes produzem padrões diversificados em uma rede composta por 
autômatos celulares. A vida artificial, que podia surgir de jogos desenvolvidos a partir 
de 1970 - como o Jogo da Vida do matemático britânico John Horton Conway -, pro- 
gredia em pesquisas matemáticas. Em 1992, no segundo congresso de Vida Artificial 
- promovido por Christopher Gale Langton -, a matemática complexa do Jogo da Vida 
encontrou-se com o Dilema dos Prisioneiros Iterado, apresentado no artigo do físico 
sueco Kristian Lindgren, que além de simples trocas de estados internos trazia os in- 


l73 Veja KRAINES, D. & KRAINES, V. Ibidem, 8 10, p. 11. 

lã Veja KRAINES, D. & KRAINES, V. Ibidem, é 18, p. 28. 

Ii Veja DENNETT, D. A Perigosa Ideia de Darwin, cap.8, 8 7, p. 291. 
176 Veja LEWIN, R. Complexidade, cap. 3, p. 69. 








gredientes cruciais para interpretação da evolução, que são competição e seleção!”. 


Lindgren desenvolveu seu modelo tendo por base a interação entre indivíduos 
iniciada por Axelrod. Axelrod tinha elaborado uma variante evolutiva do DPI com o 
intuito de testar a robustez de OPO. Construiu uma sequência de torneios virtuais que 
começavam com populações compostas pelas diversas regras participantes dos campe- 
onatos fixos anteriores. As estratégias bem-sucedidas continuavam presentes nas roda- 
das posteriores, ocupando cada vez mais o lugar daqueles que fracassavam nas etapas 
passadas. O número crescente de cópias das estratégias vitoriosas nas sucessivas ge- 
rações do torneio simulava a procriação das espécies melhor adaptadas ao ambiente. 


(...) Suponha que as interações tomem a forma de um Dilema 
dos Prisioneiros. Quando dois animais se encontram, podem 
cooperar entre si, não cooperar entre si, ou um animal poderia 
explorar o outro. Suponha também que cada animal pode re- 
conhecer indivíduos com os quais já tenha interagido e possa 
lembrar aspectos relevantes de sua intenção, tal como se o ou- 
tro fosse usualmente cooperador. Uma rodada do torneio pode 
então ser olhada como uma simulação de uma simples gera- 
ção de tal animal, com cada regra de decisão sendo empregada 
por um largo número de indivíduos. (...) Um dado animal pode 
interagir com outro animal usando sua própria regra de deci- 
são, bem como pode aparecer um animal usando outra regra 


(AXELROD, R. The Evolution of Cooperation, cap. 2, p. 49). 


Na perspectiva ecológica privilegiada por Axelrod, nenhuma mutação poderia 
ser introduzida, enquanto nos modelos evolucionários propriamente ditos, realizados 
depois, permitiam o surgimento de novas regras de comportamento no ambiente das 
novas gerações. Jogos evolucionários de DPI, como os promovidos por Nowak, Sig- 
mund, Lindgren e os Kraines proporcionavam inclusão de diferentes aspectos evoluti- 
vos: erros, má compreensão, mudança de resultados, dimensão territorial, migrações 
e adaptações à atitude do outro. Modelos mais realistas chegam agora a assumir que 
uma população monomórfica de estratégias pode ser ligeiramente modificada por gera- 
ções que se diferenciam aos poucos de seus ancestrais. A habilidade de sobrevivência e 
reprodução depende, então, da capacidade de reconhecer essas pequenas variações em 
seus parentes, reagindo com maior ou menor tolerância, de acordo com a magnitude 
das transformações. 


Nos DPI evolutivos, as interações podem ser, portanto, modeladas localmente, 
como nos autômatos celulares que atuam espacialmente com seus vizinhos laterais, ou 
globalmente, quando cada indivíduo interage com todos ao longo do jogo. A dimensão 
espacial é a principal diferença entre esses dois tipos de jogos. À ocupação territorial 
muda de forma evidente de um modelo para o outro. No modelo de autômatos celula- 
res, os parasitas podem ser rechaçados por avanços da onda espiral de alguma espécie, 
ou seja, regiões de estratégias cooperadoras podem resistir à exploração de trapaceiros, 
apresentando uma estabilidade no domínio territorial que não pode ser percebida no 
modelo todos contra todos!”*. 

IH Veja LINDGREN, Kr. “Evolutionary Phenomena in Single Dynamics”, in LANGTON, Ch. G et al. Artificial 


Life II, pp. 295-311. 
lê Veja LINDGREN, Kr. “Evolution of Behaviour in the Prisoner's Dilemma”, p. 13. 





A territorialidade afeta a evolução da cooperação em vários aspectos. Quando 
a mistura aleatória das estratégias ocupa o espaço, a reciprocidade pode sustentar 
a cooperação com uma estrutura social mínima. A reciprocidade também permitiu 
que pequenos grupos de visitantes pudessem penetrar em uma população mesquinha 
(meanies). Diversificação social surge com a identificação de membros em um grupo; 
assim, a reputação pode ser construída entre as partes. O domínio de uma estratégia 
hegemônica passa a depender da correspondência da maioria das estratégias existen- 
tes, se for benéfica para cada um e para o todo, em geral. Por fim, a interação entre 
vizinhos promoveu o crescimento de estratégias que em outro cenário não poderiam 
subsistir - tal como a inocente SEMPRE C, que pode estabelecer regiões seguras mes- 
mo em um cenário onde SEMPRE D prolifera, desde que os cooperadores da fronteira 
em contato com os desertores sejam trocados pelos bens sucedidos cooperadores do 


núcleo do nas próximas gerações!”?. 


810. A Centopeia, Indução Reversa, o Papel do Tempo 


Um dos problemas mais graves de jogos repetidos como Dilema dos Prisioneiros 
Iterado é o efeito da jogada final sobre o comportamento dos jogadores. À forte ten- 
dência para deserção acontece quando se estabelece de antemão um prazo fixo para o 
término da partida. No primeiro torneio de computadores de Axelrod, essa dificuldade 
não foi determinante, graças ao fato de nenhum dos programas que participaram do 
evento terem explorado tal propriedade dos superjogos finitos. Quando há um momen- 
to que todos sabem ser o fim do jogo, a tendência é deste ser interpretado como o jogo 
básico, onde as escolhas são feitas em função do ponto de equilíbrio original. 


No Dilema dos Prisioneiros, cuja matriz tem seu equilíbrio de Nash na deserção 
mútua, sua repetição finita levaria os jogadores a fazerem suas escolhas próximos à 
rodada final de modo a obterem, contra suas vontades, como pagamento a indesejá- 
vel punição. Pelo menos é isso o que prevê a teoria dos jogos para agentes egoístas 
racionais. Tudo porque em um jogo finito repetido várias vezes, o único equilíbrio de 
Nash existente na matriz do jogo base tende a repetir-se nos subjogos subsequentes. 
Por exemplo, a partir da matriz do Dilema dos Prisioneiros, o jogo imediato a seguir à 
deserção mútua inicial somará os resultados decorrentes dessa primeira rodada aos da 
nova etapa produzindo a seguinte figura: 


Figura 4.2 - DPI após Punição da 12 rodada 
Coluna 


= 
Estratégias Cooperar Desertar 





Quando a deserção de linha e a cooperação da coluna são somadas à matriz básica, 
produz-se, em seguida, essa nova figura: 


I79 Ver AXELROD, R. The Evolution of Cooperation, cap. 8, pp.167/8 e LINDGREN, Kr. Op. cit., p. 25. 





Figura 4.3 - DPI acumula P e Tentação de Linha 





Coluna 
——e 
Estratégias Cooperar Desertar 
6,3 4,4 Cc 
Ea | Cooperar ; ? | 
Desertar 17 li | 5, 2 c 


A possível retaliação da coluna e contrição da linha levaria então à figura abaixo: 


Figura 4.4 - P, T de Linha e Coluna acumulados ao DPI 





Coluna 
> 
Estratégias Cooperar Desertar 
6,6 4,7 c 
rr | Cooperar ; 7 | 
Desertar [7,4 Poicão 


Para finalmente, somarmos a cooperação mútua, gerando essa quarta figura: 


Figura 4.5 - DPI com P, T e Recompensa somados 





Coluna 
> 
Estratégias Cooperar Desertar 
Cooperar 8,8 6, 9c 
Linha | P | 
Desertar 19, 6 7 7 c 


Portanto, a cada nova etapa da repetição do jogo, apenas a deserção mútua se 
mantém como o equilíbrio perfeito nesse subjogo em todas as suas sucessivas etapas. 
Se a deserção perpétua (SEMPRE D), em jogos factuais e virtuais nunca é a estratégia 
vitoriosa, a despeito do que prediz a teoria dos jogos, a explicação aparece em evidên- 
cia ao se examinar o jogo criado por Robert W. Rosenthal, em 1980, e que foi chamado 
de Centopeia. O modelo da Centopeia é uma ferramenta adequada para exame desse 
tipo de comportamento. Isso porque diferente do Dilema dos Prisioneiros, trata-se 
de um jogo de informação perfeita e completa e sua solução na aplicação da indução 
reversa. 


Em jogos de informação perfeita, a indução reversa funciona como método prá- 
tico para detecção de um equilíbrio perfeito nos subjogos de um jogo estendido. A 
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partir do caminho principal, que as estratégias adotaram conforme as escolhas de cada 


um, retorna-se à raiz passando em cada ponto de decisão (nó em uma árvore). Desde as 
folhas dos últimos ramos, segue-se em direção a sua raiz. Em cada nó é-se levado pelas 
melhores escolhas de um jogador até o nó anterior do outro sucessivamente. Quando 
se chegar ao nó unitário que deu origem ao caminho seguido as demais alternativas 
podem ser eliminadas, restando apenas o conjunto dos movimentos feitos por uma de- 
terminada estratégia conjunta. Assim é possível ver qual será o resultado final do jogo 
“retrospectivamente”, antes mesmo de começar, já que todas as informações estão 
postas desde o início. A indução reversa requer que haja o conhecimento comum sobre 
a racionalidade dos agentes. Se forem racionais, a indução reversa mostrará que o pri- 
meiro jogador, na figura 2.3 da centopeia, deverá escolher logo o caminho da esquerda 
em sua escolha inicial. 


Todavia, se há a mínima probabilidade de um dos dois jogadores supor que o 
sucessor fará uma confusão, acionando “o botão errado”, o antecedente poderia fazer 
uma escolha diferente da prevista pelo paradoxo da indução reversa e racionalmente 
ir para a direita. A “mão trêmula” (trembling hands) do adversário poderia levar uma 
outra solução aceitável para a Centopeia poder andar. Sendo ou não verdade que as 
pessoas apelam intuitivamente para a “mão trêmula” - termo fixado para este tipo de 
solução -, experimentos posteriores com a centopeia raramente revelam uma jogada à 


esquerda do primeiro jogador”. 


David M. Kreps promoveu várias experiências com variantes de centopeia que 
se chocaram com a previsão fornecida pela indução reversa. Em geral, as respostas dos 
líderes indicavam o risco assumido por eles, uma vez que a perda do ponto inicial não 
significaria uma perda tão grande, quanto à possibilidade de um ganho maior caso o 
segundo jogador também tivesse ambição de chegar ao 101. Haveria como que uma 
aposta no “espírito” cooperador do outro participante. Mas essa crença não é suficien- 
te para manter um equilíbrio diferente daqueles do começo. Pequenas mudanças nos 
valores pagos que aproximassem o jogo de uma situação real podem destruir tais cren- 
ças sobre a personalidade do outro. A incerteza sobre as características do adversário 
levaria a situação dos fazendeiros de David Hume que se abstêm da ajuda do outro em 


nome da segurança e da inconfidência!?!, 


Variações da Centopeia 
Em Trust within Reason (1998), o filósofo inglês Martin Hollis (1938-1998) imagi- 


nou o jogo sequencial como a centopeia para analisar a validade da forma de raciocínio 
que poderia estar por trás da indução reversa. No Jogo das Moedas, que ele preparou, 
um montante de seis moedas estaria à disposição de dois jogadores que teriam a pos- 
sibilidade de pegar na sua vez uma ou duas moedas. Caso pegasse uma moeda, o líder 
a reteria para si passando a jogada para o próximo jogador. Se pegasse duas moedas, 
o jogo encerrar-se-ia e as quatro moedas restantes reverteriam à banca. Na sua forma 


completa, o jogo tem a árvore que aparece na figura 4.6. 


180  KREPS, D. “Game Theory and Economic Modelling”, cap. 4, pp. 11-82. 
181 Veja HUME, D. A Treatise of Human Nature, liv. III, part. II, seç. V, pp.286 e ss. 





Figura 4.6 - Jogo das 6 Moedas 





Pela indução reversa, o melhor seria “A” pegar logo as duas moedas, ao invés de 
esperar por quatro da última rodada, ou três - se quisesse parecer justo ao outro joga- 
dor. Sendo ambos agentes racionais, é válido pensar que o jogo terminará em seu lance 
inicial. Contudo, ponderou Hollis, se “A” pega apenas uma moeda pode levar “B” a 
pensar que há uma algum equívoco na sua atitude ou que não procura maximizar sua 
utilidade, pondo também em dúvida sua capacidade racional. Porém, uma iniciativa 
cooperadora como esta poderia levantar a suspeita de se tratar apenas de um ardil para 
chegar às quatro moedas no final, posto que nenhum agente racional preferiria três ao 
invés de um ganho maior. Essa segunda linha de raciocínio religaria o paradoxo da 
indução reversa, fazendo com que “B” termine o jogo em seu primeiro movimento'"*, 

A conclusão que Hollis chegou é que a indução reversa não é uma forma inválida 
de argumentar contra a cooperação entre agentes egoístas racionais, mas uma maneira 
sutil de mostrar que não se pode determinar o comportamento de um agente com base 
apenas no conhecimento comum sobre sua racionalidade. Pessoas de “carne e osso” 
têm levado a cooperação até o final nesse tipo de jogo, repartindo meio a meio o total 
oferecido na maioria das vezes. Especulações sobre tal conduta indicam que haveria 
algo mais a ser considerado fora do aparato da racionalidade pressuposta pela teoria 
dos jogos. No contexto cultural de uma sociedade, o hábito ou o costume de se levar 
uma interação até o final poderia estar na raiz da tendência desse comportamento re- 


gular produzido pela vida cotidiana!*. 


De outro modo, jogos mais curtos revelam que a formação de uma reputação 
poderia explicar que está em questão a maneira como os agentes querem ser compre- 
endidos no futuro. Assim, um jogo alternado, proposto pelo sociólogo norueguês Jon 


Elster"*, ajuda entender o papel do passado e futuro nas deliberações (figura 4.7). 


182 Veja HOLLIS, M. Trust within Reason, cap. 3, pp. 55-57. 
183 Veja HOLLIS, M Op. cit., cap. 3, p. 51. 
184 Veja ELSTER, J. “Some Unresolved Problems in the Theory of Rational Behavior”, p. 186. 





Figura 4.7 - Jogo do Ultimato 


(2,2) (3,1) 





O líder tem a oportunidade de encerrar o jogo escolhendo “B”, entretanto, por 
acreditar que II seja racional, deve arriscar-se a ganhar o máximo possível, deixando 
que este decida ficar com um ou nada ganhar. À despeito de sua racionalidade - e talvez 
por ser um INVEJOSO MODERADO -, o segundo jogador emprega a indução reversa 
e verifica que se I tivesse escolhido “B”, ambos obteriam a repartição justa de (2, 2). 
Nessa hora, sentimentos de indignação e ressentimento podem vir à tona, fazendo que 
II tenha a chance de se vingar do líder, escolhendo (0, 0). Teóricos dos jogos poderiam 
considerar irracional deixar-se levar por sentimentos morais como a indignação ou 
vergonha e buscar a vingança, abrindo mão de um ganho maior do que zero, nesses 
casos. Todavia, a tendência experimental pela divisão justa sinalizaria, sob o ponto de 
vista evolutivo, que, embora o jogo seja implementado em uma só rodada, sem repeti- 
ção, a consideração da reputação de uma pessoa justa, que não aceita uma distribuição 
flagrantemente desigual, ou vingativa, acompanha a decisão nesses modelos de jogos. 
Isto se apoia em uma projeção no tempo, passado e futuro, da expectativa de compor- 
tamento por parte do outro, que não quer passar a imagem de quem aceita qualquer 
coisa em nome de sua racionalidade instrumental. 


Em casos extremos, quando há a possibilidade de comunicação prévia entre 
agentes, o ultimato pode vir acompanhado por uma chantagem do líder ao segundo 
Jogador ou deste para o primeiro, a fim de que o outro procure favorecer os ganhos do 
próprio chantagista. Tal como Hollis, o filósofo inglês, Simon Blackburn, afirma que 
nas situações empíricas concretas, os teóricos dos jogos não podem recomendar esta ou 
aquela maneira de jogar!” 


Em casos concretos, apesar das dificuldades de descrição das situações com maior 
grau de complexidade, críticas como as de Blackburn não desautorizam as recomen- 
dações da teoria dos jogos para circunstâncias específicas que atendam as condições 
iniciais dos modelos teóricos. Para evitar as ameaças, cortar as comunicações parece 
ser um bom conselho geral. Para fazer crível uma promessa é bom ter construído antes 
uma reputação de quem cumpre a palavra e assim por diante. Por muito paradoxais 
que sejam as descrições e sugestões feitas pela Teoria dos Jogos, cada vez mais, bió- 
logos evolutivos têm encontrado razões para considerá-la um instrumento de análise 
adequado, no sentido de explicar o processo de evolução do comportamento coope- 


185 Veja BLACKBURN, S. Ruling Passions, cap. 6, p. 172. 








rativo entre seres vivos, de um modo geral, e a emergência de algumas propriedades 


relevantes a isso, em particular. 


Na filosofia, a aplicação dos modelos de jogos como Centopeia e o Dilema dos 
Prisioneiros - em suas diversas versões, pelo que foi visto até aqui, permite examinar 
aspectos importantes da evolução da cooperação e da equidade, bem como de senti- 
mentos morais e da comunicação em sujeitos racionais egoístas, sem apelar para con- 
ceitos transcendentais ou metafísicos de qualquer ordem. Além dessas características, 
outros problemas e instrumentos têm sido acrescentados, ampliando a área de atuação 
da filosofia prática e sua acuidade. Resta observar mais atentamente para onde a teo- 
ria dos jogos aponta ao invés de simplesmente recusar seus métodos com argumentos 
precipitados sobre sua inadequação em relação à tradição filosófica. 


$11. Bem Público e o Ultimato 


Além do Dilema dos Prisioneiros e da Centopeia, dois outros modelos de jogos 
têm sido objeto de vários estudos: o jogo do Bem Público e o já mencionado jogo do 
Ultimato. Esses dois tipos de jogos servem para analisar respectivamente o papel de 
um mediador e da equidade nas escolhas das estratégias. Como corolário, também são 
examinados seus efeitos com a consequente instituição de mecanismos de fiscalização, 
de controle, reputação, da influência cultural e da existência de um suposto homo 0e- 


conomicus. 


Em microeconomia, um bem público é definido como uma externalidade, cujos 
benefícios ou malefícios devem ser distribuídos igualmente entre todas as partes envol- 
vidas no consumo de seu produto ou serviço. Por externalidades entenda-se a situação 
em que uma ação individual afeta diretamente os outros agentes, trazendo consequên- 
cias que lhes são boas ou más em comparação com a condição anterior. Cada um pode 
atribuir um valor próprio a sua porção, mas esta é fornecida e usufruída da mesma 
maneira por todos envolvidos. A poluição do meio ambiente, a urbanização da cidade 
e a segurança são exemplos de bens públicos. 


Diferente dos bens privados, a utilidade individual - a satisfação que cada um 
tem segundo uma lista de preferências de consumo de bens - depende necessariamente 
da utilidade dos outros participantes. Isto é, ninguém decide sozinho a quantidade de 
bem que será obtida. Todos deverão consumir obrigatoriamente a mesma fração do 
bem público!º. 


O uso coletivo de um bem público abre margem para o aparecimento de oportu- 
nistas que “pegam carona” no investimento que os outros fazem na aquisição de algo 
que pode ser consumido em comum. Uma versão do Dilema dos Prisioneiros serve para 
explicar o fenômeno do carona quando um casal decide comprar uma televisão nova 
para seu apartamento. Um aparelho que custa 8500 pode valer a cada um $300. Se 
ambos decidem dividir meio a meio, a utilidade de cada um será 850 ($300 - $500/2). 
Entretanto, se Coluna deixar que Linha arque sozinha com a compra da TV, seu be- 
nefício sobe a $300, enquanto a compradora perde -$200. Vice-versa para o caso de 
Linha aproveitar-se da compra incondicional de Coluna. Mas se os dois desistirem da 


TV, nenhum bem será repartido entre ambos, gerando por fim, a seguinte matriz. 
1860 Veja VARIAN, H. R. Microeconomia, cap. 35, pp. 691-104. 





Figura 4.8 - Bem Público 
Coluna 


RE os 
Estratégias Comprar Não Comprar 


50, 50 -200, 300 c 
| 300, -200 10,0 c 





A estratégia dominante na aquisição de uma TV por um casal é “não comprar”. 
Qualquer um que resolver comprar a TV unilateralmente verá como o outro terá todo 
interesse em pegar carona na despesa efetuada. Quando o número de participantes de 
um bem público cresce, também aumenta a tendência de novos caronas surgirem. 


Testes com grupos de quatro jogadores distribuíram as quantias de $20 para que 
cada um pudesse investir ou não em um fundo comum ao grupo a que fizesse parte. 
Cada unidade investida recebia meio porcento de juros distribuído a todos igualmente. 
Desse modo, se todos investem de uma vez suas dotações, receberiam cada um o dobro 
do montante inicial (0.5 x $80 = 840). Entretanto, devido à baixa remuneração indivi- 
dual, cada investidor sentiria tentado a nada aplicar e receber o rendimento do investi- 
mento dos outros jogadores no fundo comum, uma vez que este é dividido igualmente 
entre eles, tenham ou não feito a aplicação, considerando que basta apenas que um o 
faça. Todavia, se todos pensarem assim, nada seria investido no empreendimento mú- 


tuo e cada um permaneceria com os mesmos $20 iniciais, sem nada ganhar além disso. 


Experimentos contemporâneos realizados em laboratórios da Universidade de 
Zurique revelaram que em jogos de Bem Público repetidos por 10 rodadas sucessivas 
a maioria das pessoas aplica, nas primeiras rodadas, cerca da metade de seu capital, 
diminuindo a cada rodada até o final quando deixa de participar do fundo de investi- 
mento. Isso ocorre porque durante o jogo as pessoas aprendem que a estratégia egoísta 
é sua dominante. Contudo, quando uma multa é instituída como punição cobrada 
aos caronas - aqueles que se aproveitam do rendimento da aplicação alheia - se reduz 
drasticamente a deserção e a maioria passa a investir valores próximos a todo capital, 


fazendo com que a cooperação prevaleça!*”. 


Outro exemplo da discussão sobre a repartição dos custos de um bem público 
ocorre nos acordos internacionais acerca da redução da emissão de poluentes na at- 
mosfera. O protocolo de Quioto, que em 2001 já contava com assinatura de 178 nações, 
comprometeu os principais países industrializados a reduzirem suas emissões em pelo 
menos 5% em relação aos níveis de 1990 até 2012. Tal compromisso foi ratificado, em 
2005, pelas partes responsáveis por mais de 55% das emissões de dióxido de carbono 
(CO,) - o principal gás relacionado ao efeito estufa -, entretanto os Estados Unidos, 
responsável por cerca de 25% das emissões de CO, em 2000, ainda não ratificaram esse 


compromisso, alegando que isto acarretaria um alto custo para sua indústria nacional 


187 Veja SIGMUND, K. “The Economics of Fairness”, pp. 3 e 4. 








que teria de se adaptar às novas exigências ambientais. Ao deixarem de se comprome- 
ter com o tratado internacional, estes países se aproveitam do benefício comum que 
a redução proporcionará ao planeta, enquanto as demais partes arcam com os custos 
dessa mudança em seus parques industriais!*, 


Os países que “pegam carona” na questão ambiental impõem às outras nações 
um custo maior do que estas teriam se todos colaborassem na diminuição da poluição. 
Isso se agrava, sobretudo, quando os maiores poluidores do mundo decidem desertar 
(EUA e China), explorando os ambientalistas. Sem um governo global, ou um me- 
canismo eficaz para determinar o cumprimento do Protocolo e punir os desvios, a 
tendência é que haja um fracasso na melhoria da qualidade de vida frente às transfor- 
mações climáticas pelas quais passa o planeta, a longo prazo. Pois, voluntariamente, 
pouca redução da emissão de gases deve ser esperada, se cada nação decidir que o que 
já foi contribuído seja o suficiente para a produção de um clima equilibrado. 


A questão relativa ao Protocolo de Quioto se arrasta lentamente devido a falta 
de consenso sobre as causas de tal mudança climática ocorrer na Terra. Sem um com- 
promisso e uma fiscalização, as partes podem exigir maiores explicações e justificati- 
vas para implementar sua cooperação adequadamente em um jogo do Bem Público. 
Nesse caso, a tentação de não cooperar e usufruir daquilo que os outros proveram é 
maior do que simplesmente participar na sua realização. É muito difícil que indivíduos 
consigam sozinhos gerar a quantidade de um bem público ótima, sem um instrumento 


que imponha a todos uma participação equânime!?”, 


$12. Pegar ou Largar 


Problemas sobre equidade são abordados pela teoria dos jogos preferencialmen- 
te no modelo de jogos do Ultimato. Esse tipo de jogo foi projetado pelo economista 
alemão Werner Giuth, por volta de 1982. No Ultimato, dois jogadores têm a chance de 
dividirem entre si a quantia de $100, em notas. Mas para isso, é preciso que o primeiro 
jogador, o líder, faça uma proposta ao segundo jogador de como repartir tal valor. Se 
este aceitá-la, o jogo termina e os ganhos são distribuídos. Porém, caso a oferta seja 


recusada, os $100 desaparecem e ambos ficam sem nada!”º. 


De acordo com a teoria dos jogos, jogadores racionais egoístas deveriam propor 
e aceitar uma divisão (99, 1), posto que o primeiro maximizará seus ganhos e o segun- 
do receberá um a mais do que zero. Todavia, essa previsão contraintuitiva falha em 
experimentos reais. Hal Ronald Varian registrou que testes feitos com universitários 
estadunidenses apresentavam, em média, uma proporção de 55% para o líder e 45% 


para o outro, sendo essa proposta aceita “na maioria dos casos”. 


Embora não seja uma divisão que possa ser considerada propriamente justa, 
como seria uma partição meio a meio, concordar com ela não deve ser considerado 


irracional, pois $45 estão próximos da maximização dos ganhos esperados ($50). Fazer 


188 Veja informações sobre a emissão de C0, nas páginas do Carbon Dioxide Information Analysis Center (CDIAC 
— Centro de Informação e Análise do Dióxiodo de Carbono) em http://cdiac.esd.ornl.gov/. 

189 Veja VARIAN, H. R. Op. cit., cap. 35, p. 113. 

190 Veja GUTH, W., SCHMITBERGER, R. & SCHWARZE, B. “An Experimental Analysis of Ultimatum Bargai- 
ning”, in Journal of Economic Behavior and Organization, 3, 361-80, 1982. 
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uma oferta favorável a si mesmo é um comportamento considerado racional para o 


líder. A rejeição daquelas que estivessem abaixo de 33% é que seria interpretado como 
paradoxal da parte do segundo jogador, porque qualquer valor acima de zero seria 
melhor do que nada receber. Se as decisões reais do recebedor divergem da previsão 
teórica,as explicações adequadas para tal comportamento devem ser buscadas fora da 
racionalidade econômica, mas em fatores psicológicos, culturais ou mesmo genéticos. 


O modelo do jogo do Ultimato foi aplicado por pesquisadores da Universidade 
de Princeton que pretendiam estudar o envolvimento das emoções em decisões relacio- 
nadas a ganhos de valores. Participaram dos testes 19 pessoas que foram submetidas 
ao exame por um aparelho de ressonância magnética, a fim de se observar que áreas 
do cérebro eram ativadas, enquanto procuravam chegar a um acordo sobre a divisão. 
Os voluntários foram informados que a divisão deveria ser feita com outras pessoas e 
com um computador, na mesma proporção. Metade das ofertas apuradas repartiam 
justamente em meio a meio, enquanto as demais tinham algum grau de desequilíbrio. 


A ressonância magnética revelou que três regiões do cérebro estavam atuantes 
na avaliação desse tipo de oferta. Uma área no centro do cérebro, ativada frequente- 
mente quando se percebe situações de conflitos, chamada córtex cingulado anterior, 
foi acionada. Além desta, a ínsula anterior esteve presente sempre que se recebia uma 
oferta considerada injusta. As propostas recusadas provocavam a participação mais 
forte dessa região, responsável pela representação de estados mentais associados à ira 
e à decepção. Completando o quadro, o córtex pré-frontal dorso lateral foi a área mais 
influente nas deliberações sobre ofertas desequilibradas. Esse órgão trabalha sempre 
que haja tomadas de decisões, fixando a meta a ser alcançada. Por conta disso, foi a 
região mais intensamente ativa nas propostas aceitas!”, 


A investigação antropológica que procurou detectar a presença do Homo oeco- 
nomicus em diversas pequenas comunidades ao redor do mundo também teve como 
teste principal o Jogo do Ultimato. O Homo oeconomicus é uma espécie fictícia inven- 
tada pelos economistas para encarnar a hipótese de que os indivíduos agem apenas 
em função de seus interesses pessoais e que para maximizar seus ganhos materiais, 
desconsideram a justiça e a reciprocidade. Esse personagem irreal já vinha tendo sua 
existência questionada por vários experimentos em laboratórios que apontavam os 
desvios dos voluntários desse comportamento padrão. Para verificar se essas variações 
apresentadas por estudantes universitários das sociedades ocidentais repetia-se em 
ambientes culturais, ainda preservados dessa forte influência comportamental, vários 
pesquisadores dos Estados Unidos e da Europa distribuíram formulários a colegas em 
12 países espalhados em cinco continentes. Foram recrutados voluntários em 15 pe- 
quenas sociedades que aparentavam comportamentos culturais e econômicos variadas 
sob condições diferentes umas das outras. Grupos de caçadores e coletores; nômades, 
sedentários e pequenos agricultores foram pesquisados. 


Tais comunidades jogaram o Ultimato, o Bem Público e também no terceiro jogo 
chamado Ditador'?. Os resultados mostraram que o modelo canônico do Homo oecono- 


192 — SANFEY, A.6. et al. “The Neural Basis of Economic Decision Making in the Ultimatum Game”, in 
Science, 300, pp. 1755-1758, 2009. 
198 O jogo do Ditador é uma variante radical do Ultimato que permite ao líder dividir a quantia segundo sua própria 








micus não resistia em nenhuma sociedade estudada. Esse padrão não é capaz de prever 
a ampla variedade de comportamento encontrada nas diversas sociedades. O grau de 
organização econômica — a presença de práticas comerciais em interações de mercado 
— interfere diretamente no nível de cooperação observado. O nível econômico do indi- 
víduo e variáveis demográficas não foram suficientes para explicar o comportamento 
de cada povo. E, por fim, o comportamento econômico da vida cotidiana transparecia 
nos resultados experimentados nessas sociedades!”, 


O jogo do Ultimato é jogado de uma só vez. Sob esse aspecto, o comportamen- 
to empírico dos seres humanos que conflitavam com a recomendação teórica da re- 
partição egoísta parece ser contraditório. Entretanto, se for jogado repetidas vezes 
o Ultimato permite que se perceba a evolução da equidade, tal como o Dilema dos 
Prisioneiros Iterado promovia a emersão da cooperação. A possibilidade do líder obter 
alguma informação sobre as respostas anteriores feitas pelos recebedores mudaria ra- 
dicalmente a configuração das ofertas propostas. 


Martin A. Nowak, Karen Mary Page e Karl Sigmund realizaram pesquisas com 
uma variante do Jogo do Ultimato informado que teve como conclusão a compreen- 
são do papel chave da formação da reputação na escolha de soluções “justas” para 
esse tipo de situação. A consolidação de uma imagem de alguém que rejeita ofertas 
baixas, ao invés de ser meramente considerada uma resposta emocional, pode ter sido 
privilegiada a longo prazo, por proporcionar ganhos próximos do ótimo de Pareto aos 
recebedores de tais propostas ao longo da evolução. Isso explicaria a revolta que mui- 
tos sentem ao receber “esmolas” ou “migalhas” dos outros. Explicaria também o fato 
de muitos rejeitavam ofertas mesquinhas, mesmo sem nunca terem jogado esse tipo de 
Jogo antes!?, 


Geneticamente as pessoas moderadas invejosas teriam a seu favor uma reputa- 
ção que obrigaria um comportamento real justo de quem se aproximasse para propor 
alguma interação que o envolve na solução. A manifestação de tal gene ocorreria com 
clareza na forma simultânea do ultimato criada por Thomas Schelling, em The Strate- 
gy of Conflict, quando duas pessoas são obrigadas a dividir $100 entre si. Postos sepa- 
rados e sem nenhum contato que permita a comunicação prévia entre eles, deveriam 
decidir como partir o montante de modo que as propostas discordantes ocasionaria 
a perda do valor disponível. O ponto focal neste caso recai na solução justa meio a 
meio, não só por causa da média aritmética óbvia, mas porque a maioria se vê como 
composta por seres semelhantes que não aceitariam nenhuma proposta que lhe fosse 


desfavorável!”º, 


Ao lado do Dilema dos Prisioneiros, os Jogos do Bem Público e do Ultimato fo- 
ram dois modelos que contribuíram decisivamente para o entendimento mais preciso 
do comportamento humano. Cooperação, reciprocidade, justiça, equidade e altruísmo 
ganharam contornos de conceitos científicos passíveis de ser detectados por experi- 
mentos em laboratório e no campo. Um grau de precisão que a filosofia não tinha ob- 
tido em mais de dois mil anos de debates intrusos. 


vontade, destinando uma fração a um recebedor passivo que não pode rejeitar os valores propostos 

194 Veja HENRICH, J. et al. “In Search of Homo Economicus”, pp. 13-14 
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196 Veja SCHELLING, Th. The Strategy of Conflict, cap. 3, p. 57. 








$13. Computadores X Estudos Acadêmicos 


O desenvolvimento de computadores ou máquinas inteligentes é algo que sempre 
esteve na agenda de filósofos visionários, pelo menos desde quando Platão começou 
a elaborar uma teoria do conhecimento em seu diálogo Teeteto. As teorias da mente 
estavam por detrás desse tipo de investigação sobre o entendimento humano torna- 
ram mais nítida a vinculação de mecanismos inteligentes ao comportamento dos seres 
vivos, a despeito do que pensava o mecanicista René Descartes (1596-1650)!”. Mas a 
invenção de autômatos reais ou virtuais não era exatamente uma inovação moderna. 
Mecanismos sofisticados já haviam sido usados por gregos do século I a.C. para calcu- 
lar a trajetória dos astros visíveis — como a calculadora mecânica descoberta em restos 
de naufrágio próximo à ilha Antiquitera, no mar Egeu. 


O materialista Thomas Hobbes não tinha dúvidas que seu Leviatã descrevia a 
constituição de um “homem artificial” que reproduzia o comportamento de todo um 
corpo social formado pelo somatório das ações de cada cidadão!*. Para tanto, bastava 
uma leitura atenta do ser humano. À observação detalhada de si mesmo deveria per- 
mitir que fosse exposta claramente de maneira ordenada, o conhecimento do gênero 
humano. À partir desse exame empírico da matéria, poder-se-ia concluir, entre outras 
coisas, que o entendimento não passa de uma imaginação decorrente do uso das pala- 
vras, que é comum tanto aos homens quanto aos animais, e por extensão as máquinas 
também. 


Desde o início do século XVII, graças ao avanço da arte da relojoaria, tentati- 
vas de construir esses mecanismos tiveram grande divulgação. Na França, Jacques 
de Vaucanson (1709-1782) construiu vários tocadores de flauta transversa, pífaros, 
tambor, bem como seu famoso “pato” que batia asas, nadava, comia grãos e depois os 
expelia. Seu conterrâneo, Julien Offroy de la Mettrie (1709-1751), chegou a ser banido, 
por sustentar, no livro [Homme Machine (O Homem Máquina, 1747), que “a alma é 
apenas um termo vão sem qualquer significado. Concluamos então audaciosamente 


que o homem é uma máquina”!?”, 


Por volta de 1833, o matemático inglês Charles Babbage (1792-1871) trabalhou 
no projeto de uma máquina de calcular, cujas características principais antecipavam 
o arranjo dos primeiros computadores eletrônicos. Ela era composta por uma porta 
de entrada de dados; uma memória de armazenamento de informação; uma unidade 
matemática, para operar os cálculos; uma unidade de controle, que indicava quando e 
como usar a informação, e um dispositivo de saída de dados, que fornecia as respostas 
impressas. O processo de computação utilizaria cartões perfurados com informação 
codificada, tal como os teares mecânicos inventados pelo francês Joseph-Marie Ja- 
cquard (1752-1834), em 1801. Embora a Inglaterra vitoriana não tivesse condições 
industriais para produzir as peças sofisticadas necessárias à construção da “máquina 
diferencial” de Babbage, como ela ficou conhecida, o estatístico estadunidense, Her- 
man Hollerith (1860-1929), pôde fabricar máquinas de somar que foram utilizadas 
para separar, contar e catalogar os resultados do censo de 1890 três vezes mais rápido 


197 Apesar de ser um dos pioneiros do mecanicismo, Descartes considerava praticamente impossível a construção de autôno- 
mos que pudessem agir pelo conhecimento, devido ao fato de não possuírem órgãos suficientes para atuarem da mesma maneira 
que os humanos (veja DESCARTES, R. Discurso do Método, part. 5, p. 51). 
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que as máquinas convencionais de então. Mais tarde, mecanismos semelhantes ao de 
Hollerith passaram a ser empregados em contabilidade e negócios, em geral, utilizan- 
do os cartões perfurados que só foram superados 90 anos depois pelas fitas magnéticas. 
Nesse ínterim, ele fundou a Computing Tabulating Recording Company (CRT) que se 
fundiu a outras empresas para formar a International Business Machine Corporation 
(ou simplesmente: IBM). 


Simultâneo aos avanços desses equipamentos, George Boole (1815-1864), ma- 
temático inglês, procurava associar as leis básicas do pensamento aos princípios da 
lógica com o intuito de eliminar as ambiguidades da linguagem natural. Em 1847, Bo- 
ole apresentou, no opúsculo The Mathematical Analysis of Logic (A Análise Matemá- 
tica da Lógica), um sistema que consiste num conjunto de símbolos, cujos operadores 


disjuntivo, conjuntivo e negação correspondiam, respectivamente, aos sinais “+”, “.” 
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e “-” que formavam expressões de valores verdadeiro (“1”) ou falso (“0”) com variáveis 
“a”, “pb”, “c” etc, representando proposições de um conjunto de sentença “S”. A álge- 
bra booleana permitia que o raciocínio fosse processado sem qualquer relação a conte- 
údos particulares e específicos, ao mesmo tempo que garantia a postulação de axiomas 
para identidade, associatividade, comutatividade, distributividade, complementação 
e todas operações básicas do pensamento. A teoria de Boole prosseguiu de forma mais 
sistemática na obra 4 Investigation of the Laws of Thought (Uma Investigação das Leis 
do Pensamento, 1854), a qual Bertrand Arthur William Russell (1872-1970) atribuiu a 


descoberta da matemática pura”. 


A aplicação da álgebra booleana aos circuitos eletrônicos só foi possível depois 
de Claude Elwood Shannon (1916-2001) concluir, em 1938, sua dissertação de mestra- 
do, intitulada “4 Symbolic Analysis of Relay and Switching Circuits” (Uma Análise 
Simbólica dos Circuitos de Interruptores e Relés). Shannon adaptou as ideias de Boole 
ao chaveamento de circuitos telefônicos, associando os estados aberto e fechado dos 
interruptores, respectivamente, aos valores falso e verdadeiro das equações lógicas. 
Esse esforço de tradução de uma linguagem formal para um aparato físico, facilitou 
a formulação de projetos e a construção de maquinário eletrônico a um custo menor. 
Desde então, a fabricação de circuitos eletrônicos, bem como posteriormente, os pro- 
gramas deveriam levar em conta instruções em linguagem de máquina sob o ponto de 
vista formal da lógica e não pelo acúmulo de operações e números da aritmética. 


Jogo da Imitação 

Toda discussão em torno da capacidade de máquinas reproduzirem a cognição 
humana, no século XX, teve como eixo o argumento de Alan Turing (1912-1954) 
apoiado no seu famoso Jogo da Imitação. O objetivo era tentar mostrar como má- 
quinas inteligentes poderiam reproduzir com perfeição o comportamento humano a 
ponto de se tornarem indiscerníveis um do outro. Isto é, à percepção de um observador 
humano, não seria possível dizer qual ação teria sido determinada por um algoritmo 
ou se fora fruto do livre arbítrio de uma mente humana??, 


Na filosofia, computadores surgiram como um tema central da Inteligência Ar- 
tificial e da Teoria da Mente. Fora desse âmbito restrito, têm sido usado tão somente 
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como máquinas datilográficas de luxo por aqueles que não sentem horror ao desenvol- 


vimento da tecnologia, como os heideggerianos. Entretanto, cada vez mais as ciências 
que estudam o comportamento humano têm utilizado essas máquinas como instru- 
mentos úteis para simulação de determinadas práticas que, ao lado dos testes labora- 
toriais feitos com voluntários humanos, ajudam a compreender melhor a emergência 
de atitudes cooperativas, sentimentos de justiça, indignação ou mesmo de instituições 
como Estado ou a polícia. 


Apesar das críticas emocionais, nem sempre razoáveis, que surgem contra esse 
tipo de abordagem, os computadores estão se fixando como mecanismos valiosos para 
refutação de hipóteses filosóficas que de outro modo permaneceriam eternamente em 
meio à especulação sobre sua viabilidade prática. Computadores, desde o início, ser- 
viram como modelo para compreensão de particularidades das faculdades cognitivas. 
No Jogo da Imitação de Turing, uma máquina e uma pessoa ocupariam o lugar de 
um homem ou uma mulher, enquanto um interrogador, localizado em uma outra sala 
deveria adivinhar o sexo de quem respondia suas perguntas. A melhor estratégia para 
uma máquina seria tentar oferecer de forma “natural” as respostas como se fosse um 
ser humano. Turing acreditava que um computador com capacidade de memória con- 
veniente — em torno de 1 gigabite — poderia imitar o comportamento humano nesses 
exames tão bem que uma pessoa comum não seria capaz de fazer uma identificação 


correta com 70% de probabilidade, em menos de cinco minutos de teste?”, 


O teste de Turing visava encontrar um método para determinar se máquinas po- 
deriam pensar, mas dependia de uma percepção de terceira pessoa sobre o desempenho 
teatral. Esse aspecto intersubjetivo do jogo de imitação foi criticado pelo filósofo da 
linguagem John Richard Searle, como insuficiente para definir se o programa embu- 
tido na máquina compreende ou não aquilo que responde ao interrogador. Em 1980, 
Searle escreveu o artigo “Minds, Brains and Programs” (Mente, Cérebro e Programas), 
no qual lançou a distinção das pesquisas que visavam esclarecer os processos mentais, 
como causas do comportamento das partes do cérebro — ou IA fraca -, daquelas que 
consideravam o cérebro como um computador e a mente o seu programa — a IA forte. 
Para Searle, a IA fraca permite a harmonia entre as abordagens biológicas e o que 
se sabe sobre o mundo, enquanto a IA forte, ao tentar criar mentes artificiais estaria 
condenada ao fracasso, pois nenhum programa de computador seria suficiente para 
fornecer um sistema inteligível. 


Nesse artigo, Searle apresentou o experimento mental batizado de “quarto chi- 
nês”, como um contra-exemplo às pretensões dos partidários da TA forte. Um falante 
de uma língua ocidental — o português, no nosso caso — é isolado numa sala que contém 
vários símbolos em mandarim — língua oficial da China -, cujo significado ele desconhe- 
ce. Sobre uma mesa, há um manual em português com regras de como o “lusófono” 
deve entregar os símbolos corretos, toda vez que determinados cartões, em mandarim, 
lhe forem mostrados. Desse modo, observando no manual a correlação específica en- 
tre os sinais recebidos e os enviados, a pessoa dentro da sala, induz o destinatário de 
seus cartões, do lado de fora, falante do mandarim, a acreditar que ele compreende 
sua língua. No entanto, o falante do português trancado na sala, na verdade, não en- 
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tende uma palavra em mandarim. Tudo que ele faz é seguir as instruções contidas no 


manual. Moral da história: se o manual, semelhante ao programa de um computador, 
não ensina palavra alguma em outra língua ao leitor, então nenhum computador, ao 
executar um programa, compreende o conteúdo daquilo que está sendo processado. 
Tal como o personagem na sala, o computador apenas segue as instruções formais 
para manipular símbolos em uma sintaxe correta, sem compreender seu significado 


semântico”, 


Com isso, Searle atacava a pretensão de que o teste de Turing fosse suficiente 
para atribuir corretamente uma mente a máquinas, pois seu desempenho poderia ser 
uma mera imitação formal, sem entendimento do conteúdo da ação. Por apresentar 
apenas um comportamento sintático formalmente correto, o computador não conhece 
a semântica, o contexto real de sua atuação, ou a intenção de seus estímulos ou res- 
postas”, 


A inspiração do “quarto chinês” é uma adaptação de experimento semelhante 
imaginado por Ned Block no artigo “Troubles Wuh Functionalism” (Problemas com o 
Funcionalismo, 1978). O chamado “ginásio chinês” reunia, num estádio maior que o 
Maracanã, milhões de pessoas para que elas transmitissem sinais umas às outras, por 
meio de rádios de fala-escuta — numa analogia ao funcionamento dos neurônios. As- 
sim, seguindo uma série de regras, a multidão conseguiria responder a perguntas sobre 
histórias em mandarim, embora o ginásio não entendesse uma palavra dessa língua. É 
curioso notar que a intenção de Block era defender a teoria computacional do cérebro, 
o oposto do que Searle propôs. Contra o conexionismo, Searle diz que as conexões cor- 
respondentes às sinapses neurais não simulam as propriedades causais que provocam a 
sua compreensão, por mais perfeita que seja a emulação do funcionamento do cérebro. 
Falta-lhes habilidade para produzir estados intencionais. Para Searle, “o que quer que 
seja a intencionalidade, é um fenômeno biológico o qual deve ser tão causalmente de- 
pendente da bioquímica específica de suas origens como o é a lactação, a fotossíntese 


ou quaisquer outros fenômenos biológicos.”?'. 


Um dos paradigmas da Inteligência Artificial forte atacada por Searle eram os 
programas de xadrez, que na época de Turing ainda eram muito precários. Anos de- 
pois, filósofos como Hubert Lederer Dreyfus, precipitavam-se em dizer que esse tipo de 
programa jamais chegaria a vencer a habilidade humana para jogar xadrez. O tempo 
passa e, em 1997, com a vitória do computador Deep Blue sobre o enxadrista russo 
Garry Kasparov, mais esse mito filosófico cai por terra. 


Imitação da Vida 

Pouco a pouco, a evolução dos programas foi superando os obstáculos cognitivos 
a ponto de computadores terem se tornado modelo de racionalidade para tal como nos 
primeiros conceitos de razão na modernidade adotados por lógicos e filósofos da teoria 
do conhecimento. Os computadores serviram também para elaboração de programas 
que buscavam simular não só um tipo de inteligência, mas a própria reprodução da 
vida no planeta. À teoria matemática dos sistemas dinâmicos, na física, procurou ex- 


plorar as analogias dos ciclos de ascensão e queda de organismos vivos e sociedades 
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em modelos de jogos que representariam o processo de desenvolvimento da vida real. 


O jogo da Vida, de John Horton Conway, trabalhava a ideia de uma máquina 
de Turing que visaria passar no teste de simulação do aparecimento, sobrevivência e 
morte de sistemas complexos, como a vida, a partir de um conjunto de regras simples. 
A imitação da vida, tal como da inteligência trouxe a possibilidade de se usar os com- 
putadores como instrumentos adequados para o exame de hipóteses acerca dos algo- 
ritmos que poderiam estar por detrás do desenvolvimento dos principais fenômenos 
biológicos evolutivos. 


No modelo de Conway, leis genéticas de nascimento, reprodução e morte descre- 
veriam a forma com que organismos ocupariam um território, tal como autômatos 
celulares em um tabuleiro infinito (de Go ou de Xadrez, com as casas de uma mesma 
cor). Cada célula ocupada desta tabela representaria um organismo que interage com 
as oito casas que a cercam. Passam à geração seguinte — próximo movimento do jogo 
— os pontos adjacentes a duas ou três casas ocupadas. Com quatro ou mais vizinhas, 
a superpopulação extingue o respectivo ponto. Enquanto o ponto solitário ou com 
apenas um vizinho desaparece pelo isolamento. Novos organismos surgem sempre ao 
lado de três vizinhos exatos. Com base nessas regras, três cenários poderiam surgir: 
nenhum padrão conseguiria avançar indefinidamente; aparentemente os padrões for- 
mados cresceriam sem limite; ou se dispersariam até desaparecerem completamente 
ou congelariam ou cairiam em um ciclo eternamente oscilante. De todos cenários pos- 
síveis, Conway concluiu que nenhuma configuração inicial com um número finito de 


organismos conseguiria progredir indefinidamente sem chegar a um limite?”. 


A vida no computador, tendo por modelo autômatos celulares, com regras sim- 
ples de geração e extinção, reproduziu o conhecido padrão cíclico das populações des- 


coberto pelos matemáticos Lotka e Volterra?. 


(...) O ciclo, que é o padrão mais conhecido na biologia das 
populações, descreve a interação entre populações de uma espé- 
cie predadora e sua presa. Com essa população estabelecida de 
presas, a população de predadores aumentará. Finalmente, os 
predadores começam a exercer um sério impacto na população 
de presas, que começa a diminuir. 


Com menos presas para comer, os predadores começam a sofrer 
e sua população diminui. Liberta da pressão dos predadores, a 
população de presas agora tem um impulso, seguida pela popu- 
lação de predadores. O ciclo de ascensão e queda das popula- 
ções continua indefinidamente (...) (LEWIN, R. Complexidade, 
cap. 5, p. 119). 


O movimento cíclico que aparece nitidamente no jogo da vida emerge também 
no jogo dos Pombos e Falcões repetidos por Richard Dawkins, Maynard-Smith e Ro- 
bert Trivers. Nos computadores, três teorias cruciais desenvolvidas no século XX têm 
o ambiente propício para os seus encontros e desdobramentos. Inteligência Artificial, 
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Teoria do Caos e dos Jogos abordam de modo complementar os aspectos particulares 
de uma teoria geral sobre o surgimento, sobrevivência e destruição dos organismos 
vivos. Por meio de computadores, de hipóteses simples podem ser extraídas consequ- 
ências complexas em geral. Tal instrumento, mostrou como características locais, em 
larga escala, poderiam fazer surgir “propriedades emergentes” das interações entre 
indivíduos em um sistema global. 


O uso de computadores na avaliação de hipóteses facilita a observação de dis- 
crepâncias de conclusões consideradas razoáveis de estudos meramente acadêmicos e 
dedutivos. Axelrod chamou atenção para os equívocos de deduções tiradas das análises 
acadêmicas feitas sobre a estratégia RETALIADOR PERMANENTE. Alguns ensaios 
consideraram que RP possuiria as condições mínimas para sustentação da cooperação 
e da confiança. Contudo, os torneios de computadores de Axelrod, onde RP partici- 
pou, revelaram que se trata de uma estratégia perigosa, uma vez que teria ficado nas 


piores colocações entre as estratégias gentis — aquelas que começam cooperando”. 


Essa discussão ilustra dois princípios. Primeiro, que fazer bons 
conselhos depende não apenas das propriedades dedutíveis da 
estratégia em questão, mas também das condições exatas sob as 
quais a estratégia será usada. Em um mundo de agentes adap- 
tativos, mesmo um jogador plenamente racional precisa levar 
em consideração o que o outro jogador está provavelmente ex- 
perimentando ao invés de otimizando. Segundo simulações ofe- 
recem uma rica possibilidade para checar a eficácia das ideias 
estratégicas em ambientes que são altamente diversos (AX EL- 
ROD, R. “On Six Advances in Cooperation Theory”, p. 15). 


Todo trabalho sobre o comportamento feito em laboratórios de informática tem 
servido para testar hipóteses que filósofos mais atentos, como o estadunidense Daniel 
Clement Dennett, têm considerado válidas e estimulantes, até mesmo para questões 
éticas. Fatores como o reconhecimento mútuo, comunicação e reciprocidade têm se 
pr, por 
exemplo. Embora o mecanismo dos jogos não seja adequado para formulação de leis 


mostrado como condições necessárias para o processo de evolução da mora 


científicas deterministas, este pode ser utilizado corretamente na preparação de expli- 
cações probabilísticas de procedimentos difíceis de ser definidos intuitivamente pela 
mera observação dos fenômenos sociais. Com a teoria dos jogos, é possível compreen- 
der quais são os principais componentes a serem considerados em uma relação entre 
dois ou mais agentes racionais e as possíveis consequências de seus atos. No sentido de- 
finido por Luce e Raiffa, a teoria dos jogos e seus modelos computacionais não devem 
ser entendidos como propositores de normas absolutas da maneira pela qual as pessoas 
se comportam ou deveriam agir. Porém, sua função tem sido até agora prescrever as 
linhas de ação viáveis, caso as partes desejem atingir os fins específicos. 


(...) Ela prescreve para dadas hipóteses cursos de ação para 
atender os resultados que tenham certas propriedades formais 
“ótimas”. Tais propriedades podem ou não ser consideradas 
pertinentes em algum dado conflito de interesses no mundo 
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real. Se eles forem, a teoria prescreve as escolhas que precisam 
ser feitas para alcançar o ótimo (LUCE, R. D. & RAIFFA, H. 
Games and Decisions, cap. 4, $ 4.3, p. 63). 








II parte 
Nodelos de jogos 








Capítulo 5 
Dilema dos Prisioneiros Iterado 


AS agora, a discussão feita sobre a Teoria dos Jogos e a Teoria da Cooperação procu- 
rou apresentar os conceitos principais e os princípios mobilizados na modelagem 
da interação entre agentes racionais seja por meio de matrizes, seja na forma estendi- 
da de árvores de Kuhn. De imediato, procurou-se mostrar os antecedentes históricos 
dessas teorias, levantando suas principais obras e autores. Logo em seguida, o segundo 
ponto tratou de revelar como são construídas as tabelas da forma estratégica e da for- 
ma extensiva que permitem que sejam feitas abordagens diferentes na interpretação 
de um mesmo jogo que tem características próprias que são reveladas quando jogados 
simultaneamente — nesse caso as matrizes são a melhor forma de representação — ou 
quando há uma sucessão de movimentos alternados entre os jogadores — situação que 
se descreve adequadamente no esquema de uma árvore. 


Depois disso, passou-se à definição dos conceitos de estratégia dominante, ponto 
de sela, equilíbrio, estratégias mistas e solução maximin. Foram exibidos exemplos e 
técnicas práticas ou intuitivas para detecção das estratégias que podem determinar o 
fim de um jogo, ou marcarem precisamente o seu desenvolvimento. A primeira uni- 
dade encerrou-se com um ponto problemático para essas teorias que se encontram na 
concepção de racionalidade. A imagem de jogadores que atuam como se fossem agen- 
tes racionais egoístas trouxe alguns paradoxos para a busca dos resultados que maxi- 
mizassem sua utilidade. Ao agirem assim, em situações como a do Dilema dos Prisio- 
neiros, tudo que os envolvidos conseguiriam seria um resultado abaixo do ótimo de 
Pareto para todas as partes. Questionamentos iniciais sobre a psicologia dos agentes 
naturais, levantados pelo economista francês Maurice Allais obrigaram a formulação 
de novos conceitos que compuseram a teoria das perspectivas (Prospect Theory), cuja 
explicação desses problemas subjetivos dos agentes racionais frente ao risco garantiu a 
distinção do prêmio Nobel de Economia para Daniel Kahneman, em 2002. 


No segundo capítulo, fez-se a abordagem de um assunto específico em que se 
trata do papel da comunicação na solução de jogos. Nesse momento, quando ameaças, 
acordos obrigatórios, informação perfeita e os principais conceitos relativos aos temas 


comuns à teoria dos jogos e da comunicação surgem para estabelecer uma aproximação 








entre essas duas teorias. Os principais conceitos comuns dos Jogos com Comunicação 


e da teoria filosófica da comunicação foram listados a fim de estabelecer as correlações 
e divergências entre essas duas interpretações dos fenômenos comunicativos. A aplica- 
ção dos principais conceitos dos Jogos com Comunicação aos modelos tradicionais da 
teoria dos jogos e às situações próprias de jogos falados levaram a uma nova compreen- 
são dos eventos comunicativos. A racionalidade instrumental pode ser compreendida 
como sendo uma atividade mental básica que pode ser complementada pela razão 
comunicativa. Os modelos de jogos com comunicação servem para revelar os limites 
da ação comunicativa e estabelecer o contato entre as duas formas de racionalidade. 


A seguir, foi introduzida a Teoria da Cooperação elaborada por Robert Axelrod 
que utiliza o modelo do Dilema dos Prisioneiros repetido várias vezes, como um super- 
jogo, para avaliar como a cooperação pode emergir entre agentes egoístas. Superjogos 
têm como característica a produção de uma infinidade de estratégias em equilíbrio. A 
Teoria da Cooperação de Axelrod permitiu que se encontrasse um método para seleção 
de um ponto de equilíbrio entre tantos concorrentes. Nesse sentido, a interpretação 
da evolução pelos modelos de jogos foi desenvolvida por meio de torneios de compu- 
tadores. Os torneios de computadores elaborados por Robert Axelrod serviram para 
renovar a interpretação sobre a origem da cooperação entre seres racionais ou não 
considerados egoístas. Através desses torneios várias estratégias foram examinadas, a 
fim de encontrar aquelas que fossem mais propícias à fomentação do comportamento 
cooperativo. 


Apesar dos torneios de computadores elaborados por Robert Axelrod terem tra- 
zido novas luzes sobre a forma que a cooperação pode surgir entre seres egoístas, o 
modelo padrão do Dilema dos Prisioneiros Iterado recebeu várias críticas. Muitos su- 
geriram alternância nos movimentos, possibilidade de erro e lances feitos de acordo 
com uma taxa de variação. Mudanças significativas na montagem da simulação em 
computadores ajudaram a tornar mais realistas as estratégias vitoriosas em um Di- 
lema dos Prisioneiros Iterado. Alternância dos movimentos, possibilidade de erro e 
outras características desenharam programas mais sofisticados que funcionavam bem 
em um cenário, mas não em outros. 


O Dilema dos Prisioneiros Iterado passou por uma história de transformações e 
adaptações às características que procuravam refinar cada vez mais sua descrição das 
relações entre agentes racionais. Ruído, troca de papéis e evolução foram ingredientes 
importantes nessa sofisticação do modelo de DPI que revelaram detalhes que antes 
não poderiam ter sido discutidos. Além desse dilema, outros jogos foram modelados 
para avaliar com maior precisão os paradoxos encontrados. O jogo da Centopeia é um 
deles. A centopeia permite examinar o papel do tempo e da indução reversa como fa- 
tores a influenciar o comportamento de agentes racionais, nem sempre intuitivamente 
aceitáveis. 


Para realizar os experimentos com esses modelos de jogos, o uso de computado- 
res foi o instrumento privilegiado seja assumindo o papel de um jogador fictício, seja 
como meio pelo qual as jogadas eram feitas entre os agentes. Além da Teoria dos Jogos 
e da Cooperação, os computadores trouxeram grande contribuição ao debate filosófico 
do século XX em diante. Na Inteligência e Vida Artificiais, na disputa do Dilema dos 


Prisioneiros Iterado, a computação permite entender e testar hipóteses que de outro 








modo permaneceriam infundadas no campo da especulação dos estudos acadêmicos. 
Com isso, a teoria da mente e a filosofia prática tiveram um campo novo aberto pelos 
computadores que ainda tem muito por ser explorado pelos filósofos. 


Os jogos do Bem Público e do Ultimato são dois outros modelos de interações 
estudados pela teoria dos jogos que permite a avaliação de fatores importantes para o 
florescimento da cooperação como a instituição de mecanismos de controle e sentimen- 
tos de justiça e equidade. Através desses exemplos trabalhados em testes laboratoriais 
e de campo pôde-se verificar as dificuldades de aceitação das hipóteses mais fortes da 
teoria sobre a existência de um imaginário homo oeconomicus, cuja racionalidade es- 
tratégica por vezes tem de ceder aos sentimentos de justiça e reputação. Sentimentos 
esses que foram consolidados na história evolutiva da espécie humana ou na forma 
como a sociedade restringe os efeitos da exploração entre seus membros. 


Modelagem dos Principais Jogos e suas Consequências 


Nesta segunda parte, segue-se uma abordagem mais detalhada dos métodos 
utilizados para o emprego dos principais modelos de jogos que foram sumariamente 
descritos na primeira parte. A defesa da simulação, como uma nova forma de apoiar 
ou refutar as hipóteses levantadas, é exposta logo em seguida a essa recapitulação. As 
linguagens de computador mais adequadas para iniciantes e pesquisadores avançados 
são sugeridas. Depois, as estratégias derivadas da famosa OLHO POR OLHO são 
também discutidas como uma família de estratégias que tem seu uso otimizado em 
situações específicas. Estratégias híbridas e da família pavloviana também são con- 
frontadas. Ao final do capítulo, então, desenvolve-se o debate em torno das principais 
condições que o DPI precisa satisfazer para que surja a cooperação entre indivíduos 
racionais. 


Com o capítulo seis, os modelos do Jogo dos Bens Públicos trabalhados por di- 
versos autores são montados como ferramenta adequada para análise e implicações do 
comportamento de um agente que assuma o papel do carona. Tal como na definição de 
David Hume para a personalidade do patife esperto, a figura do carona tornou-se na 
Teoria dos Jogos o representante desse tipo de conduta nociva à cooperação que visa 
produzir um bem comum. Para resolver os problemas causados pela atuação desastro- 
sa desse ator, ao contrário do que talvez pensasse Hume, faz-se necessário a punição 
e a presença de um terceiro elemento, ou uma instituição como o Estado para obrigar 
o cumprimento dos acordos. Só assim a cooperação poderá ser considerada viável, em 
situações como a formalizada pelo Bem Público. 


Em seguida, o Jogo do Ultimato, apresentado em seus diversos experimentos, 
coloca em maior relevo o papel da reputação que não poderia ser detectado claramente 
nos dois modelos anteriores. Sua formulação simultânea e sem comunicação prévia, 
antecipada por Thomas Schelling, tem na solução justa de um ponto focal a possibili- 
dade de compreensão de um sentimento inato de justiça que pode ser a manifestação 
de algum caráter específico em vez de ser apenas uma conclusão aritmética adequa- 
da. Com essa observação em mente a pesquisa que revelou a ausência de um suposto 
“homem econômico” - imaginado pelos teóricos dos jogos -, em meio à sociedade pode 
também vir a reforçar a hipótese do sentimento de justiça inato, bem como o papel das 


práticas sociais atuando sobre as deliberações dos indivíduos. Destarte, será oportuno 








aportar as condições que surgem no Ultimato para o aparecimento e atuação da equi- 


dade como solução ótima para jogos desse tipo. 


Por fim, a construção de jogos tal como sugerida pelos vários teóricos que se de- 
dicam à formalização do processo de decisão entre agentes racionais têm sua utilização 
indicada aos campos de investigação sobre o comportamento de seres vivos em geral 
e do ser humano em especial. Em muitos domínios fora da economia e administração, 
os jogos vêm servindo como instrumento de avaliação das hipóteses elaboradas para 
descrever tal desempenho. A biologia evolutiva foi uma das primeiras disciplinas a em- 
pregá-los para explicação de pontos problemáticos da evolução. A psicologia também 
chegou a merecer distinção como a teoria sobre o comportamento do homem racional 
frente a situações de risco. Agora, até mesmo a neurologia encontra-se entre as disci- 
plinas que aplicam os testes dos jogos para detecção de áreas do cérebro responsáveis 
pela deliberação e reações emocionais ou racionais. 


A própria filosofia foi uma das primeiras áreas a reconhecer a importância dos 
jogos através da obra de Richard B. Braithwaite, Theory of Games as a Tool for the 
Moral Philosopher, que propôs um princípio equitativo, segundo orientação forneci- 
da por uma fronteira de eficiência. De lá para cá, John Rawls (1921-2002), em Uma 
Teoria da Justiça (1970), também valeu-se de instrumentos matemáticos para tratar 
do problema de distribuição, enquanto David Gauthier desenvolveu toda uma teoria 
contratualista da moral fundada na Teoria dos Jogos, em Morals by Agreement (Moral 
por Acordos, 1986). Esses autores, entre outros, que vêm transformando a filosofia 
contemporânea trabalham como o novo instrumental, a fim de enfrentar argumentos 
críticos de outras áreas das ciências humanas que cobram maior precisão das propo- 
sições filosóficas. Mas não só em precisão ganha a filosofia como o emprego dos jogos, 
principalmente na clareza pretendida desde o início da modernidade. Uma conclusão 
favorável ao trato da Teoria dos Jogos por parte dos filósofos deverá, portanto, fechar 
esta trajetória, destacando as vantagens de se aliar esse método de investigação às res- 
trições críticas próprias da disciplina. 


$14. Simulações 


Embora o uso de computadores não seja uma novidade para as ciências naturais 
— desde a II Guerra Mundial vinham sendo utilizados como ferramentas de cálculo ou 
como mecanismos de experimento virtual -, as simulações são uma inovação para as 
ciências sociais, sobretudo, depois dos torneios de Robert Axelrod. Estas têm servido 
para o exame das consequências das hipóteses trabalhadas em cada área de conheci- 
mento. Nesse sentido, as simulações surgiram como um terceiro método de avaliação 
científica ao lado da indução empírica ou da dedução axiomática. 


Em várias áreas das ciências sociais, da antropologia, economia, biologia evo- 
lutiva, direito até a política, foram produzidos artigos sobre o método da simulação 
publicados em mais de 50 jornais científicos diferentes. Axelrod destaca, em artigo 
dedicado ao avanço das técnicas de simulação — pelo menos até 2003 -, dos sete pro- 
pósitos atribuídos a essa prática, a previsão, o fornecimento de provas e descoberta. 
As previsões através das simulações são realizadas por meio de dados que alimentam 
o sistema que os processa, gerando consequências relacionadas com a hipótese de tra- 


balho. Tais consequências podem servir como provas quando os eventos observáveis 








ao final aparecem como efeitos esperados das regras simples que representam os prin- 


cípios testados. Além de consolidarem os modelos de condutas pelos quais a simulação 
é baseada, esta nova técnica de averiguação de princípios científicos pode ser útil tam- 
bém para descobrir novas formas de relacionamento. A despeito das dificuldades de 
se moldar detalhadamente o movimento das pessoas em sociedade, as simulações têm 
servido para o encontro de estratégias e normas comportamentais que partem de um 
conjunto de instruções limitado. 


Simulação vem se constituindo em uma terceira forma de fazer 
ciência. Como a dedução, parte de um conjunto de proposições 
explícitas. Mas diferencia-se desta por não provar teoremas. 
Ao invés disto, a simulação gera dados que podem ser analisa- 
dos indutivamente. Diferente de uma indução típica, por outro 
lado, a informação simulada trabalha a partir de um conjunto 
de regras rigorosamente especificado que não envolvem medi- 
ções diretas do mundo real. Enquanto a indução pode ser usada 
para encontrar padrões informativos, e a dedução pode ser usa- 
da para encontrar hipóteses consequentes, a simulação, se bem 
modelada, pode ser usada como ajuda à intuição (AXELROD, 
R. “Advancing the Art of Simulation in the Social Sciences”, p. 
o). 


Assim, a simulação vem em auxílio aos tradicionais experimentos mentais rea- 
lizados por filósofos como Thomas Hobbes, David Hume e Jean-Jacques Rousseau. 
Propriedades emergentes dos sistemas dinâmicos complexos surgem de umas poucas 
proposições simples. Através das simulações, pode-se questionar a necessidade deduti- 
va de se manter o pressuposto da escolha racional como princípio básico da teoria dos 
Jogos, propondo em seu lugar a adaptação como processo principal nos estudos das 
populações que não agem de modo racional pleno. O postulado da racionalidade não é 
indispensável na modelagem do comportamento de agentes nas condições tratadas por 
Jogos repetitivos como no Dilema dos Prisioneiros. 


Metodologicamente, as simulações são baseadas em agentes autônomos. Portan- 
to, se inscrevem na categoria do individualismo metodológico das ciências sociais que 
trabalha as instituições como mecanismos onde sujeitos são considerados “peças” e 
“engrenagens” fundamentais que explicam a montagem, a existência e o funciona- 
mento de um sistema maior. Trata-se, então, de uma técnica ascendente de construção 
das propriedades características de um sistema a partir das interações dos agentes. 


Os históricos dos resultados das simulações podem ser descritos, por conseguinte, 
de três maneiras diferentes. Pela ordem cronológica, as ações podem ser descritas como 
desenrolar de fatos relacionados causalmente uns com os outros. Da perspectiva do 
agente, suas decisões podem ser interpretadas como reveladoras dos efeitos do tempo 
sobre suas jogadas. Por fim, a visão geral de todo processo permite perceber os padrões 
em larga escala do comportamento de todos participantes. Com isso, as variações dos 
parâmetros da modelagem da simulação podem revelar a influência de cada fator no 
resultado geral do agente, do processo e de todos os participantes em conjunto. O que 
vale dizer que os resultados partilhados dependem de detalhes relativos à maneira 


como a simulação foi preparada. 








Nesse sentido, pesquisadores de disciplinas distintas podem interferir na sua ava- 


liação dos resultados das pesquisas de outros, perscrutando resultados sensíveis a sua 
área de atuação. Faz-se então necessário que o código fonte do programa utilizado seja 
também informado. Na prática, Axelrod recomenda a programação em Visual Basic 
para iniciantes em informática e a linguagem Java para programadores avançados. 
Entre esses dois processos, JavaScript é um recurso disponível para pesquisadores de 
nível intermediário, capazes de modelar jogos como o Dilema dos Prisioneiros Iterado. 


Críticas ao Modelo 


Apesar das simulações terem uma vasta aplicação em diversas áreas de pesqui- 
sa, seu uso em contextos pedagógicos está sujeito a críticas como as levantadas por 
Howard Gardner acerca da desinformação que jogos, como o famoso SIM CITY, 
podem transmitir às crianças. Um dos preconceitos praticados pelas primeiras versões 
desse simulador do governo de uma cidade é revelado pela recorrente revolta da popu- 


lação da cidade fictícia sempre que os impostos são aumentados pelo prefeito virtual, 


Por outro lado, a interpretação biológica da utilidade como a habilidade de uma 
estratégia reproduzir-se nas futuras gerações é filosoficamente problemática quando 
se analisa sob a ótica da influência cultural. Individualmente, a habilidade reflete na 
obtenção de ganhos superiores aos de outros jogadores. À acumulação quantitativa de 
bens talvez seja uma concepção limitada para o conceito de aptidão, nesses contextos. 
De fato, tais limitações estão vinculadas ao comportamento racional dos agentes cul- 
turais, que variam de indivíduo para indivíduo. No âmbito da comunidade, as habili- 
dades, ou aptidões, do agente devem ser interpretada sempre como uma racionalidade 
restrita aos valores de cada sociedade. 


Ademais, a história de uma cooperação ou constituição de um grupo social, 
quando modelada pelos jogos é irrelevante caso se compreenda tal processo como de- 
corrente de uma sequência causal determinada pelas regras programadas. Para ser 
considerada válida, a simulação de jogos evolutivos teria de ser contraposta a testes 
empíricos que procurassem apontar ou não a alternativa virtual como mais uma entre 
as várias histórias passíveis de acontecer ou serem destacadas do pano de fundo coti- 
diano. Assim sendo, as simulações seriam irrelevantes, uma vez que teriam de passar 


sempre crivo da experiência histórica real, a fim de ter sua plausibilidade constatada?”. 


Não obstante essas objeções, autores como Richard Dawkins têm feito uso da 
simulação da maneira prevista por Axelrod, para verificar a correção de suas intui- 
ções. As vantagens da simulação permanecem como a melhor forma da experimentar 
várias suposições uma após a outra, sem os custos de preparar muitos testes empíricos 
de campo. 


(...) Há, evidentemente, bons e maus modelos do mundo, e 
mesmo os bens são apenas aproximações. Nenhuma simulação 
pode prever exatamente o que acontecerá na realidade, mas 
uma boa simulação é muito preferível à tentativa e erro cega 


(DAWKINS, R. O Gene Egoísta, cap. 4, p. 82). 


Um computador pode rodar em pouco tempo várias propostas que consumiriam 


212 GARDNER, H. O Verdadeiro, o Belo e o Bom, cap. 3, p. 48. 
213 ALEXANDER, J. McK. “Evolutionary Game Theory” 3 4, pp. 9-11. 








uma grande quantidade de tempo se examinada por métodos tradicionais. Tentativas 
empíricas de testes de projetos custam muito tempo e energia. Se imaginar os efeitos 
devastadores dos testes nucleares, as vantagens da simulação desse tipo em computa- 
dores merecem o rótulo de ecologicamente corretas. 


Dilema dos Prisioneiros Iterado 


Como se sabe, o Dilema dos Prisioneiros é um exemplo clássico de experimento 
montado por meio dos modelos de jogos estudados pela Teoria dos Jogos, desde 1950. 
A simulação iterada (DPI) ficou popularizada, depois de Robert Axelrod ter lançado 
dois torneios de programas de computadores, nos quais diversos pesquisadores foram 
convidados a apresentar estratégias que pudessem vencer um campeonato onde todas 
tomassem parte. Seu livro The Evolution of Cooperation (A Evolução da Cooperação, 
1984) trouxe os resultados desses torneios e lançou a base da chamada Teoria da Coo- 
peração. 


O Dilema dos Prisioneiros foi assim batizado depois que Albert W. Tucker ter 
usado a história de dois suspeitos presos pela polícia para explicá-lo a uma audiência 
de psicólogos da Universidade de Stanford. Originalmente, no entanto, o experimen- 
to fora inventado nos laboratórios da corporação RAND, em janeiro de 1950, pelos 
matemáticos Merrill Flood e Melvin Dresher como um contra-exemplo ao conceito 
de equilíbrio de Nash. Embora essa experiência tenha sido iniciada em 1950 e citada 
por centenas de artigos entre os anos 60 e 70, só em 1980, Tucker iria publicar sua mo- 
nografia sob o título On Jargon: The prisoner's dilemma (Sobre o Jargão: O Dilema dos 
Prisioneiros). Trata-se da situação em que se encontram dois criminosos capturados 
pela polícia, mantidos em celas separadas, e que são interrogados isoladamente a fim 
de que um possa acusar o outro. O inspetor encarregado das investigações tem provas 
suficientes apenas para condená-los por um crime leve, mas sabe que ambos comete- 
ram algo mais grave. No intuito de levá-los à confissão, propõe a cada um a liberdade, 
por auxiliar a justiça, desde que entregue o outro comparsa, que arcaria, caso ficasse 
calado, com a pena máxima. Ao se denunciarem mutuamente, os dois presos pegariam 
uma sentença dura, mas atenuada pela confissão. Ao contrário, no entanto, se perma- 
necessem de boca fechada, os dois ficariam pouco tempo na cadeia. Jogado de uma só 
vez, o Dilema do Prisioneiro apresenta apenas a deserção geral como único equilíbrio 
de Nash dominante. 


Não obstante, em 1984, Axelrod propôs dois torneios de computador nos quais 
era possível jogar o Dilema dos Prisioneiros, várias vezes, iterado. Para esses campe- 
onatos, foi montada uma tabela de pontuação em que a tentação de denunciar era 
premiada com 5 pontos, a recompensa por ficar calado era de 3 pontos, a punição 
pela delação mútua pagava só 1 ponto, enquanto o pagamento simplório (sucker) de 
O ponto caberia a quem ficasse em silêncio sozinho. Os ganhos nesse jogo se reduzem 
a condenações que são consideradas muito boas, justamente boas, justamente más ou 
muito más, traduzidas no sistema de pontuação da figura 3.1, onde R > (T+S)/2. 


Em cada célula da matriz, por convenção, o primeiro resultado é atribuído ao jo- 
gador 1, na linha, enquanto o segundo corresponde ao ganho do jogador 2, na coluna. 
O DPI é jogado por um certo número de rodadas até o seu final (como se os prisioneiros 
fossem interrogados separadamente várias vezes). O placar é calculado a cada rodada. 


O objetivo é otimizar a pontuação antes do final do jogo. No final do jogo, o placar é 
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apresentado em porcentagem do melhor resultado possível. Inicia-se o jogo decidindo 
cooperar ou desertar e então faz a melhor escolha conforme o resultado obtido. 


As simulações de DPI podem apresentar dois tipos de cenários distintos: deter- 
minista ou indeterminista. Numa simulação determinista, as estratégias são jogadas 
puras, isto é, a probabilidade de cooperar é de O ou 100 por cento. Ao passo que, no 
cenário indeterminista (com ruído), a cooperação pode variar de acordo com uma taxa 
aleatória ou mistura de estratégias ótimas. Existem tão somente 16 tipos de estraté- 
gias deterministas - na figura 5.1, estão listadas todas as estratégias deterministas - as 
mais estudadas têm o nome assinalado - e a RANDOM (que varia sempre a uma taxa 
de 50%). As estratégias indeterministas, no entanto, são infinitas, sendo variações 
das estratégias puras originais. Algumas estratégias puras podem ter versões gentis 
ou não, respectivamente, cooperando ou desertando na primeira rodada, como por 
exemplo OLHO POR OLHO, cuja versão pura não gentil é SUSPEITOSO OLHO 
POR OLHO. 


Figura 5.1 - 16 Estratégias Deterministas e 1 Randômica 








E, 0 0 0 só coopera após P 
E, 0 0 1 só coopera após T 
E; 0 0 1 coopera após T ou P 
E, 0 1 0 só coopera após S 
Es 0 1 1 (0) coopera após S ou T 
E; 0 1 1 1 só deserta após R 
1 (0) (0) O 'RETALIADOR PERMANENTE 
1 (0) (0) 1 [dA MONTA 
1 (0) 1 (0) OLHO POR OLHO 








Es> 1 1 0 coopera após R ou S 
Eis 1 1 (0) só deserta após T 
EX 1 1 1 só deserta após P 
Eis 1 1 1 1 SEMPRE "CC" 

E 0,5 05 05 0,5 RANDOM 
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$15. A Família de Estratégias TIT FOR TAT 


O sucesso de OPO nos primeiros campeonatos virtuais de DPI chamou aten- 
ção para essa estratégia simples, mas que tinha consequências surpreendentes aos que 
achavam difícil fazer emergir a cooperação a partir de seres egoístas. O espanto inicial 
e as críticas em torno da forma como aqueles torneios tinham sido montados levaram 
à preparação de novas simulações, a fim de testar pontos específicos de uma interação 
ou que estivessem mais próximos de uma concepção realista dos contextos nos quais 
as escolhas dos indivíduos ocorrem. Nesses vários experimentos, outras estratégias se 
sobrepuseram à OPO original. Entretanto, os autores que defendiam a robustez deste 
algoritmo fizeram algumas modificações no intuito de adaptá-la às novas circunstân- 
cias. Por conta disso, surgiu uma série de estratégias variantes da versão determinista 
de OPO que acabaram por formar uma grande família de estratégia. 


De acordo com a notação adotada nos novos torneios, as estratégias poderiam 
ser facilmente representadas em um conjunto que exprimisse a probabilidade de co- 
operar após os respectivos resultados - (C, C); (C, D); (D, C) e (D, D) -,isto é (R,S, T, 
P). Estratégias “puras”, que variam suas chances de cooperar ou desertar, mas deser- 
tam ou cooperam com probabilidades fixas de O ou 1, são chamadas de deterministas 
porque não misturam suas opções e seguem rigidamente os comandos propostos pelo 
seu programa, sem qualquer margem de erro ou produção de acaso. À estratégia OPO 
pura, opera a regra (1, O, 1, 0), iniciando sempre de forma gentil, isto é, cooperando. 


Uma simples mudança na propriedade da gentileza (nice) de OPO, que a for- 
ce começar o jogo desertando, permitiu a criação da regra conhecida como SUSPI- 
CIOUS TIT FOR TAT (SUSPEITOSO OLHO POR OLHO, SOPO). No contexto de 
uma pequena população, composta por jogadores OPO gentil e suspeitoso, a estratégia 
OLHO POR DOIS OLHOS (OP20) - que retalia após duas deserções seguidas - pode 
invadi-la por ser uma boa cooperadora de OPO e SOPO, enquanto esta última entra 
em retaliação permanente contra a primeira. Tal resultado mostra que a robustez de 
OPO, que se mostrou válida na versão ecológica tratada por Axelrod, não se reproduz 
adequadamente em qualquer conjunto de estratégia, sujeitando-se, eventualmente, 
ao aparecimento de mutantes ou invasores. Nenhuma estratégia determinista seria, 
portanto, evolutivamente estável, 


Efetivamente, os ambientes naturais, nos quais haja a presença de ruído e alter- 
nância das jogadas, para uma estratégia determinista como OPO se sair bem, é pre- 
ciso que seja feita uma mistura de suas decisões, gerando estratégias estocásticas cuja 
probabilidade de cooperar seja maior do que zero e menor do que um (0 < p < 1). As 
experiências feitas por Martin A. Nowak e Karl Sigmund, desde 1992, com estratégias 
estocásticas, em DPI infinito, permitiu que o lance inicial que determinava a gentileza 
da linha de ação fosse considerada irrelevante para o desenvolvimento do jogo, uma 
vez que a memória estava limitada à rodada anterior e os efeitos da largada eram es- 
quecidos e diluídos ao longo da partida. Nessas circunstâncias, a GENEROSA OLHO 
POR OLHO tornou-se vitoriosa e estável - resistente à invasão e mutações. A versão 
estocástica de GOPO (1,0, 1, 2/3) instrui aos jogadores cooperarem após uma punição 


al4 Pelo menos essa foi a conclusão das pesquisas realizadas por Robert Boyd e Jeffrey P. Lorberbaum e publicadas na 
revista Nature de 07 de maio de 1987 sob o título “No Pure Strategy Is Evolutionarily Stable in the Repeated 
Prisoner's Dilemma Game”, Veja BREMBS, B. Chaos, Cheating and Cooperation, pp. 15 e 16, bem como AXELROD, 
R. The Evolution of Cooperation, cap. 2, p. 5. 








2/3 das vezes. Sua tolerância ou generosidade possibilitou a vitória em 39 das 40 si- 
mulações em que foi testada, dominando após 600 mil em 10 milhões de interações”. 


A propriedade da clemência ou do esquecimento era maior em GOPO do que em 
OPO e isso foi um fator decisivo no desenlace de seu bom desempenho em jogos evolu- 
tivos. À rigor, a clemência mostrou ser mais necessária do que a gentileza. A atuação 
dessa estratégia alterou o comportamento de OPO em dois pontos chaves. Por um 
lado, permitiu a tolerância a erros de execução do comando ou de interpretação. Por 
outro lado, evitou o efeito de eco permanente pela defasagem da retaliação de enganos 
cometidos por estratégias semelhantes. A OPO determinista reage bem com estraté- 
gias diferentes da sua em contextos randômicos, mas cai em uma retaliação fratricida 
contra os erros de estratégias gêmeas, enquanto a generosidade de GOPO recompõe 
a cooperação em poucos movimentos após um lance equivocado da outra parte. Esse 
resultado não passou despercebido de Axelrod que, junto ao cientista político chinês 
Jianzhong Wu, destacou que a 


[g]enerosidade é efetiva ao deter a repetição contínua de um 
simples erro, se o erro foi cometido pelo próprio agente ou por 
outro jogador. O nível de generosidade determina quão rapida- 
mente um erro pode ser corrigido e a cooperação restaurada. 
O problema é que a generosidade requer um balanço entre a 
rapidez na correção do erro e o risco de exploração (WU, J. & 
AXELROD, R. “How to Cope with Noise in the Iterad Prisoner's 
Dilemma”, p. 6). 


Outra variante que permite cobrir os próprios erros do agente, chamada CON- 
TRITE TIT FOR TAT (COPO), conseguiu obter bons resultados no cenário ecológico 
- sem o surgimento de mutações ou invasões - do segundo torneio de Axelrod, acres- 
centado de ruído. COPO evita retaliar a deserção do outro se esta deserção foi provo- 
cada pelo próprio jogador. COPO atua como um agente arrependido de ter ganho uma 
vantagem imerecida, mantendo a cooperação após uma justa retaliação por parte do 
outro. Junto a GOPO, COPO forma uma família de estratégias robustas, em torno de 
OPO, na maioria dos ambientes ruidosos”"º. 


Generosidade e arrependimento são dois aspectos da condição de clemência que 
se aplicam respectivamente à relação externa com o outro e interna, consigo mesmo. 
A clemência (forgiving), que a primeira vista foi um dos fatores relevantes do sucesso 
de OPO nos torneios puros, foi também sistematicamente desafiada pelos especialis- 
tas que prepararam suas estratégias, dentro do espírito competitivo, para derrubar 
essa estratégia no segundo turno. Axelrod considerou esse equívoco capital para as 
intenções das outras regras em atingir os melhores resultados possíveis. Seus progra- 
madores esqueceram que ser razoavelmente tolerante ajuda a estabelecer a cooperação 
entre todos. Um incremento na tolerância de OPO, realizado por GOPO e COPO seria 
a razão para estratégias dessa família conseguirem resistir e prosperar em contextos 
nebulosos e incertos como aqueles nos quais erros e confusões podem acontecer. GOPO 


por si só chegou a constituir uma gama de estratégia com base em uma versão pura - 
(1, 0, 1, 1) - denominada FIRM BUT FAIR (FIRME MAS JUSTO, FMJ), também 
215 Veja NOWAK, M. A. & SIGMUND, K. “The Alternating Prisoner's Dilemma”, à 4, p. 225. 


2l6 Veja AXELROD, R. “On Six Advances in Cooperation Theory”, p. 21 e WU, ] & AXELROD, R. “How to Cope 
with Noise in the Iterad Prisoner's Dilemma”, p. 1. 








chamada família FATR (JUSTO). 


Pagar na mesma moeda revelou ser uma linha de ação eficaz para enfrentar es- 
tratégias estranhas que não cooperem sistematicamente ou aquelas não gentis - que 
começam desertando. Mas mostrou falhas em reconhecer e tolerar enganos de seus 
próprios semelhantes. Tais falhas poderiam ser corrigidas antecipadamente, caso as 
informações sobre quais seriam os cooperadores entre os futuros jogadores enfrenta- 
dos estivessem disponíveis a tempo. Saber se um agente é um mesquinho desertor 
(SEMPRE D), antes da interação, ajudaria a reduzir os pagamentos feitos aos maus 
cooperadores, em geral. Uma variante intitulada OBSERVER TIT FOR TAT (OB- 
SERVADOR OLHO POR OLHO, OOPO) agiria nos primeiros encontros com um par- 
ceiro gentil tal como OPO, porém, atacaria com uma ação não gentil - igual a SOPO 
-, desertando no primeiro lance, se o outro jogador fosse um desertor historicamente 
conhecido. Desse modo, OOPO seria eficaz para explicar a exigência por controles so- 
ciais com severas ameaças aos exploradores, a fim de reduzir a presença de desertores 
em curto prazo. A longo prazo, a sombra do futuro e as retaliações decorrentes dos 
sucessivos encontros seriam bastantes para inibir a deserção””. 


Outras Famílias Notáveis 


Além de OPO, outras famílias de estratégias puderam ser constituídas tendo 
como origem estratégias deterministas modificadas para o ambiente evolutivo com 
ruído. PAVLOYV (1,0, 0, 1) tornou-se a principal concorrente de OPO em jogos simul- 
tâneos ruidosos. Sob o parâmetro de Axelrod (R =3;S5=0;T=5;P= 1),a estratégia 
PAVLOV está sujeita à invasão de agentes mesquinhos, que sempre desertam. Em 
poucas rodadas, seu frágil método de retaliação permite sua exploração por SEMPRE 
D. Entretanto, no padrão de Nowak e Sigmund (R = 3;S=0;T=4; P= 1), PAVLOV 
determinista consegue obter bons resultados por ter a capacidade de restabelecer a 
cooperação com rapidez”. 


A diferença principal entre PAVLOV e OPO foi apontada por Nowak e Sigmund, 
em 1994. Enquanto a última procura imitar o comportamento dos seus oponentes, 
PAVLOVY orienta suas ações apenas pelos resultados recebidos. Agindo assim, os pavlo- 
vianos conseguem ir bem entre si ao recuperarem rapidamente a cooperação, depois de 
uma deserção mútua equivocada. Os pavlovianos não precisam entender muito sobre 
como funciona a mente do outro ou afinal o que está em jogo no DPI, basta apenas 
mudar sua ação quando os ganhos não forem favoráveis. Ao lado da PAVLOV determi- 
nista, Axelrod testou, em uma retomada randômica de seu segundo torneio, uma ver- 
são generosa dessa estratégia (GPAVLOV), que coopera um décimo das vezes, depois 
da deserção do outro jogador. 


No ambiente ruidoso, enfrentando outras 63 estratégias, Axelrod percebeu que 
as duas versões de PAVLOV não ascendiam das últimas posições. A PAVLOVY original 
ficou em 55º lugar e GPAVLOV na 48º colocação. Na disputa ecológica - evolução sem 
mutação -, os pavlovianos foram levados à beira da extinção, sobrando apenas um 
milionésimo de seus praticantes, depois de cem gerações. Ademais, PAVLOV, que fun- 
ciona bem em jogos simultâneos com ruído, torna-se instável em jogos alternados”. 


ali Veja BREMBS, Bj. “Chaos, Cheating and Cooperation”, p. 11. 
2l8 Veja WU, ]. & AXELROD, R. Op. cit. p. 6 e NOWAK, M. A. & SIGMUND, K. Op. cit. $ 3, p. 222. 
219 Veja WU, J. & AXELROD, R. Idem, p. 4. 








Apesar desses resultados decepcionantes, PAVLOV reage bem contra estraté- 
gias específicas. Exceto pela primeira rodada, em um jogo alternado, PAVLOV resiste 
às tentativas grosseiras de exploração de uma versão invertida de OPO (ANTI-TIT 
FOR TAT, AOPO) - também chamada de BULLY (FANFARRÃO), por David Krai- 


nes e Vivian Kraines (Figura 5.2). 


Figura 5.2 - Jogo Alternado 
FANFARRÃO DC CGC saND CC Cr 


PAVLOV DD DD... CD DCD |... 





FANFARRÃO, ou AOPO (0, 1, 0, 1), sabe explorar os cooperadores incondicio- 
nais (SEMPRE C), desertando contra a cooperação, mas se deixa explorar por SEM- 
PRE D, pois, ao contrário de OPO, coopera sempre com desertores. Diferente de OPO, 
ao invés de imitar o comportamento adversário, AOPO procura fazer o oposto do que 
o outro faz. Melhores resultados são obtidos pelas variantes híbridas de PAVLOV que 
constituem uma combinação com OPO. Dessa forma, FIRME MAS JUSTO, patriarca 
da família JUSTO, alia a robustez de OPO com a facilidade de adaptação de PAVLOV. 
Uma versão estocástica de FMJ, variante de GOPO - chamada de TOUGH LOVE 
(AMOR BRUTO, AB), por Kraines e Kraines -, foi a vencedora de um Dilema dos 


Prisioneiros Alternado com memória”. 


PAVLOV também ajuda a formar outra família quando se une ao RETALIA- 
DOR PERMANENTE (1,0,0,0) - família GRIM - para estabelecer GRIM PAVLOV, 
um algoritmo que mantém a deserção, mesmo depois de ter punido a sua deserção 
acidental. Compõe ainda a família GRIM a versão suave do RETALIADOR PERMA- 
NENTE denominada GRIM BUT RELENTING (RETALIADOR DELICADO). 
Ao invés de promover a deserção perpétua depois de ser simplório, o RETALIADOR 
DELICADO refaz a cooperação depois de dois erros consecutivos. Dessa maneira, os 
retaliadores permanecem robustos à invasão dos desertores incondicionais (SEMPRE 


D), ao mesmo tempo em que reduzem os vícios de naturais enganos?!, 


A proliferação de tantas famílias de estratégias, a partir de pequenas unidades 
interativas, revela a gradativa emergência da complexidade em relações e nos compor- 
tamentos dos seres vivos, no lento processo de seleção natural. Regras simples como as 
propostas por tais algoritmos, construídos e apoiados nas reações possíveis ao Dilema 
dos Prisioneiros, pode estar na base da explicação das reações químicas das macromo- 
léculas de ácido desoxirribonucleico (ADN), como sugeriram Nowak, Robert May e 
Sigmund, 


As simulações em computadores serviram para mostrar simplificadamente como 
um processo de cooperação como esse pode ter surgido e se sustentado por meio de 
organismos vivos. 


(...) Sofisticadas criaturas podem ser desenhadas para seguir 
estratégias que encorajam a cooperação por causa de repetidas 


220 Veja KREINES, D. & KRAINES, V. “Protocols for Cooperations”, à 8.3, p. 14. 
22] Veja KREINES, D. & KRAINES, V. Op. cit, 8 15, pp. 25 e 26. 
222 Veja NOWAK. M. E. MAY, R. M. & SIGMUND, K. “The Arithmethics of Mutual Help”, p. 81. 








interações entre indivíduos que podem reconhecer e relembrar 


uns aos outros. (...) No curso da evolução, parece ter havido 
ampla oportunidade para cooperação ter assistido a todos des- 
de os humanos às moléculas. Nesse sentido, a cooperação po- 
deria ser tão velha como a própria vida em si (NOWAK. M. 
A. MAY, R.M. & SIGMUND, K. “The Arithmethics of Mutual 
Help”, p. 81.) 


As propriedades e condições que fazem a cooperação emergir entre os sistemas comple- 
xos serão discutidos, a seguir. 


$16. Condições para Cooperação 


Os diversos experimentos realizados em torno do Dilema dos Prisioneiros Ite- 
rado, todas simulações e torneios de computador, bem como as estratégias construí- 
das para enfrentar as peculiaridades de cada situação subsidiaram a discussão sobre 
as condições e os pressupostos que promovem o comportamento cooperativo entre os 
jogadores. Compreender quais são os fatores que contribuem para formação e manu- 
tenção da cooperação é uma das metas principais da filosofia política, da ética, e da 
psicologia comportamental. Uma sociedade bem-ordenada só pode se manter como 
tal se houver a cooperação entre seus membros. Cooperar com o outro é um aspecto do 
altruísmo que pode ser explicado, mesmo entre agentes egoístas, sem perda de consis- 
tência, por conta dos efeitos da reciprocidade exigida pelas partes e que fundamenta 
princípios éticos fortes como a conhecida Regra de Ouro - “faça ao outro aquilo que 
gostaria que fizesse a si mesmo”. 


O livro The Evolution of Cooperation, de Robert Axelrod, é o responsável pelo 
lançamento dessa Teoria da Cooperação que procura responder à simples questão de 
como agentes egoístas podem seguir cooperando uns com os outros, sem a necessidade 
de nenhum instrumento externo - como o Estado, instituições jurídicas ou contratos 
que obriguem a levar em consideração os interesses dos outros. De um ponto de vista 
radical, nem mesmo uma racionalidade forte seria requerida para que a cooperação 
emergisse e, por conseguinte, até mesmo organismos muito simples - bactérias, vírus 
etc. - poderiam ser considerados aptos a tomar parte de uma interação fácil de se per- 
ceber como o Dilema dos Prisioneiros. 


Por conta de sua montagem simplificada, biólogos, políticos, economistas e ma- 
temáticos puderam propor uma ampla gama de cenários onde os agentes poderiam 
atuar. À concepção de agente utilizada partilha da noção de agência creditada do filó- 
sofo estadunidense Daniel Dennett. Um agente dennettiano tem capacidade suficiente 
para praticar ações, ao invés de apenas sofrê-las. Este agente atua em função de razões 
ou conjunto de instruções sobre as quais não tem consciência??. 


Fora da filosofia, um agente dennettiano corresponde a sistemas complexos di- 
nâmicos, às macromoléculas orgânicas e aos autônomos celulares. Organismo que re- 
agem entre si segundo regras, leis da física ou química e programas instalados. Assim 
sendo, a reprodução do comportamento de unidades reativas tão básicas pôde ser per- 
petrada convenientemente em torneios virtuais de computadores. As simulações que 
se sucederam às primeiras competições promovidas por Axelrod trataram de explorar 
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as consequências e conclusões anunciadas em 1984. 


Em seu livro, Axelrod apresentou as condições que considerava responsáveis pela 
vitória da estratégia OLHO POR OLHO entre as cooperadoras. A ação de OPO era 
clara, gentil, retaliadora e clemente. Essas quatro primeiras condições eram tidas, en- 


tão, como sendo a chave explicativa para a robustez exibida nas disputas iniciais?”, 


Com base nessas propriedades, alguns conselhos foram proferidos como sendo 
adequados para jogadores desenvolverem sua finalidade em uma longa interação do 
tipo do Dilema dos Prisioneiros: não ser o primeiro a desertar, não ser invejoso, nem 
ardiloso e responder com reciprocidade à cooperação e a deserção?2. A ambição de um 
ganho maior sobre o outro jogador eventualmente conduz a uma tentativa de reparar 
o desequilíbrio dos resultados. Isto leva, então, a uma deserção que visa retificar as 
perdas sofridas. Dessa forma, jogadores invejosos provocariam a ruína mútua através 
de uma série de punições repetidas. Por ser uma estratégia que nunca busca vantagem 
sobre os ganhos dos outros, OPO consegue no máximo igualar os ganhos aos do outro 
Jogador ou um pouco abaixo do outro. Mesmo assim, no ambiente dos dois primeiros 
torneios, foi a estratégia que obteve a melhor pontuação média em comparação às 
demais. 


Os ganhos equilibrados de um jogador OPO ocorreram por que este nunca é o 
primeiro a desertar. A gentileza inicial evitava a deflagração de conflitos desneces- 
sários. Estratégias gentis, não por acaso estiveram entre as melhores colocadas, não 
obstante o fato da deserção ser uma estratégia dominante na versão básica do Dilema 
dos Prisioneiros, em uma só rodada. A falta de gentileza pode trazer vantagens ime- 
diatas, mas a longo prazo degrada a convivência necessária para sua proliferação ao 
futuro, como ocorreu a todas estratégias desse tipo na disputa ecológica feita depois 
do segundo torneio”. 


Muita sofisticação e sutilezas dos programas não foram características próprias 
aos algoritmos que tiveram êxito no DPI. Comportamentos ardilosos e muito com- 
plexos podem, dada a dificuldade de compreensão pela outra parte, ser considerados 
aleatórios, imponderáveis, ou irresponsáveis. Desta forma, estratégias difíceis de en- 
tender são perigosas devido à falta de clareza sobre suas ações o que gera desconfiança 
em quem deve participar da cooperação. A clareza de OPO foi uma das razões para seu 
desempenho vitorioso. Ao contrário do jogo de soma zero, onde ocultar informações 
sobre sua linha de ação dificulta as tomadas de decisões do adversário a ser derrotado, 
em jogos de soma variável, como o DPI, onde se busca a cooperação do outro, é im- 
portante parecer transparente, sinalizando e fornecendo garantias de que o objetivo de 
ambos maximizarem seus resultados passa pela cooperação mútua. Tal transparência 
das ações é reforçada à medida que a cooperação for sendo retribuída com cooperação 
e deserção punida com deserção. De todos os conselhos extraídos dessa forma de inte- 
ração, a prática da reciprocidade é o mais eficaz, de um modo geral. 


Objeções e Respostas 


Como sempre ocorre em debates filosóficos, esses conselhos e as propriedades 


224 Veja AXELROD, R. The Evolution of Cooperation, cap. 2, p. 54. 
225 Veja AXELROD, R. Op. cit. cap. 6, p. 110. 
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relacionadas às estratégias vitoriosas nas simulações e intuitivamente aceitáveis fo- 


ram criticados por outros pesquisadores que não estavam satisfeitos com as conclusões 
tiradas. Kenneth Binmore atacou duramente as propriedades atribuídas a OPO, ad- 
vertindo que, em contextos específicos, estratégias que não fossem claras, gentis, reta- 
liadoras e clementes poderiam também ser bem-sucedidas””. Além deste, vários outros 
pesquisadores consideraram irrealistas as primeiras simulações e introduziram novos 
ingredientes, a fim de aproximar aquelas descrições ao ambiente natural cotidiano. Al- 
ternância de movimentos, possibilidade de erro ou má compreensão, memória de mais 
de uma rodada, ao lado de diversos outros aspectos ligados à topologia do território 
foram criados para tornar ainda mais precisas as observações feitas sobre a interação 
entre os organismos. 


De um modo geral, todas as dificuldades postas acabaram por confirmar os re- 
sultados iniciais que apontavam para a possibilidade da cooperação evoluir na maioria 
das circunstâncias examinadas. Contudo, de acordo com a avaliação de Robert Hof- 
fmann - feita duas décadas depois de constantes debates aos torneios iniciais - outras 
estratégias, que não a OPO determinista, poderiam promover a cooperação sob certas 
condições. Toda uma família de estratégias variantes de OPO foi gerada. Outros algo- 
ritmos híbridos permitiram a ligação entre famílias concorrentes, diluindo as frontei- 
ras entre estratégias cooperadoras. 


Os resultados dessa literatura, portanto, confirma um número 
de descobertas chaves dos trabalhos teóricos. Primeiro, a coo- 
peração é possível em equilíbrio quando jogadores não levam 
em consideração o término do jogo. Segundo, na estrutura 
evolucionária, qualquer estratégia que propague rigidez pode 
ser em última instância deslocada por formas alternativas de 
comportamento (HOFFMANN, R. “Twenty Years On”, $ 4.2, 
p. 10). 

De todos os atributos estratégicos e condições necessárias para a cooperação, a 
reciprocidade surge como elemento principal. Contudo, outros fatores relevantes aju- 
dam a entender porque a cooperação nem sempre ocorre entre espécies diferentes e 
como ela pode ser mantida em meio à adversidade. Relacionamentos mais complexos 
em cenários que envolvam eventos aleatórios, mudanças territoriais, erros, alternância 
etc. mostraram a necessidade de manutenção de um contrato estável ou uma larga 
“sombra do futuro”, no intuito de permitir a previsão comportamento do outro a par- 
tir de uma adaptação a longo prazo, com obtenção de resultados favoráveis o bastante 
para que a deserção não viesse a ser compensada. 


[A] utilização e extensão do paradigma original do Dilema dos 
Prisioneiros Iterado entre duas pessoas provieram de ricas pos- 
sibilidades os efeitos de uma ampla faixa de fatores tais como 
o tempo dos movimentos tomadas de garantias, redes sociais, 
adaptação, inveja, ruído e mobilidade. À luz de extensa lite- 
ratura existente, sobre os modelos relatados, os resultados os 
ordenaram detalhadamente, relacionando-os com cada fator, 
(...) bem como sugerem uma contínua adoção de novos temas 


221 Um sumário dessas críticas encontra-se em BINMORE, K. “Review: The Complexity of Cooperation”, resenha 
de 1998. 








(AXELROD, R. “On Six Advances in Cooperation Theory”, pp. 
31/32). 


A simplicidade dos modelos empregados nas simulações realizadas delineou 
como a cooperação entre organismos complexos pode emergir no ambiente biológico 
natural, a partir do permanente incentivo a repetida interação entre indivíduos. O 
reconhecimento e as lembranças das ações passadas de cada um estimulavam os seres 
inteligentes a manter a cooperação entre os cooperadores e a deserção para os que têm 
má reputação de desertores. Nos casos de agentes mais simples, próximos aos autôma- 
tos celulares, a cooperação resiste em face da reação da vizinhança. 


Direta ou indiretamente, a reciprocidade é, portanto, uma condição necessária 
para sustentação a cooperação. Mas essa não é a única maneira disso acontecer. Sem a 
memória ou qualquer recordação das ações passadas, a reciprocidade deixa de ser um 
fator efetivo. Nesses casos, apenas a similaridade, ou o recurso ao reconhecimento de 
uma marca ou etiqueta que identifique um parceiro semelhante ao seu algoritmo, seria 
capaz de fazer prevalecer a tolerância ou a cooperação entre os agentes. No entanto, 
a proliferação das etiquetas ou mesmo a falsificação delas podem gerar equívocos cus- 
tosos àqueles que só cooperam pela observação de sinais externos. Entretanto, essas 
características fisionômicas ou comportamentais poderiam explicar a aplicação de me- 
canismos etnocêntricos, como forma de garantir a cooperação entre os membros de um 


grupo identificado pelos mesmos rótulos ou etiquetas”. 


Na prática, a similaridade pode explicar o florescimento da cooperação entre 
espécies ou etnias. Porém, embora à primeira vista possa parecer uma forma simples 
e econômica de encontrar parceiros bons cooperadores, as etiquetas implicam em um 
custo crescente no refinamento do aparato de identificação, a fim de evitar falsificações 
e o oportunismo dos organismos que mimetizam as maneiras do outro se apresentar ou 
comportar. Recorrer a garantias, por vezes acaba em regressão ao infinito de um in- 
ferno burocrático em torno do aval das garantias, fiadores, garantias dos fiadores etc. 


Se as sinalizações por meio de etiquetas podem enfrentar problemas de identi- 
ficação ao longo do tempo, a reciprocidade obriga que os jogadores estejam atentos 
para as ações executadas pelos outros. Mais do que as palavras, importa aos agentes 
recíprocos os resultados obtidos da interação. Em todo caso, as recomendações não são 
tão simples quanto possam parecer as regras adotadas. Intuitivamente, permanecem 
válidos os conselhos de Marco Polo a Kublai Khan em As Cidades Invisíveis, de Ítalo 


Calvino (1923-1985). 


O inferno dos vivos não é algo que será; se existe, é aquele que 
já está aqui, o inferno ao qual vivemos todos os dias, que for- 
mamos estando juntos. Existem duas maneiras de não sofrer. 
A primeira é fácil para a maioria das pessoas: aceitar o inferno 
e tornar-se parte deste até o ponto de deixar de percebê-lo. A 
segunda é arriscada e exige atenção e aprendizagem contínuas: 
tentar saber reconhecer quem e o que, no meio do inferno, não é 
inferno, e preservá-lo e abrir espaço (CALVINO, IT. As Cidades 
Invisíveis, 9, p. 150). 


228 Veja RIOLO, R. L., COHEN. M. D. & AXELROD, R. “Evolution of Cooperation without Reciprocity” e AXELROD, 
R. & HAMMOND, R. À. “The Evolution of Ethnocentric Behavior” para o assunto das etiquetas. 








O DPI apresenta alguns aspectos básicos relacionados com a emersão da coope- 


ração entre agentes egoístas em interação direta, uns com os outros. Evolutivamente, 
espécies de primatas, além do Homo sapiens, comportam-se como altruístas recípro- 
cos que consolidaram estratégias em situações semelhantes ao dilema dos prisioneiros. 
Sem embargo, convém notar que o DPI é adequado para análise do comportamento 
entre duas partes. Para mais de dois jogadores, outros modelos esclarecem pontos que 
não são precisamente detectados em simulações baseadas em jogos bimatriciais (2 X 


2). Os Bens Públicos vêm esclarecer outros aspectos da cooperação em dilemas sociais. 








Capítulo 6 
Bens Públicos 


Dilema dos Prisioneiros Iterado tem sido o modelo mais aplicado quando se tra- 

ta de estudar a cooperação entre duas partes egoístas, mas que dependem uma 
da outra para atingir um resultado ótimo. Entretanto, se o número de participantes 
sobe acima de dois jogadores, o trato fica difícil de ser modelado por meio de matrizes, 
ou árvores de Kuhn. Efetivamente, os torneios que confrontavam várias estratégias 
funcionavam como campeonatos de partidas contra os programas rivais e no final o 
somatório dos pontos definidos para cada partida, determinava qual obtivera maior 
número de pontos e, por fim, a estratégia vencedora. 


Os jogos chamados de Bens Públicos são uma extensão do Dilema dos Prisionei- 
ros para mais de dois jogadores. Em economia, um bem público é entendido como algo 
que deve ser usufruído em proporções semelhantes por todas as partes envolvidas em 
sua produção e consumo. Em geral, os bens públicos são oferecidos por instituições 
governamentais, mas nada impede que empresas privadas também os gerem. Podem 
ser serviços ou efeitos colaterais da ação de um grupo ou indivíduo que seja membro 
deste. A poluição é um exemplo do impacto das ações de indivíduos sobre a natureza 
que afetam todos em uma região ou até mesmo em escala global. 


Nos países desenvolvidos ou em desenvolvimento, os parques industriais e a ex- 
pansão de fronteiras agrícolas provocam a emissão de gases - fumaça decorrente da 
transformação dos materiais, queima de combustíveis, ou queimada de florestas. Os 
resultados dessa devastação são sentidos por todos os habitantes do planeta Terra, 
quando o aquecimento da atmosfera, gerado por esses gases afetam o clima em esca- 
la mundial. Nações subdesenvolvidas, ou mesmo aquelas desenvolvidas que investem 
em meios de produção sustentáveis ecologicamente, têm reivindicado o direito ao “ar 
puro” ou uso de tecnologias que não agridam tanto o meio ambiente. O suposto direito 
ao ar puro também é passível de troca por meio de tratados internacionais que exigem 
compensações adequadas pela perda de um pouco desse bem comum. 


Nesse sentido, acordos como o Protocolo de Quioto previam o comércio de emis- 


sões entre os países comprometidos em reduzir o lançamento de gases relacionados ao 








efeito estufa e aqueles que obtivessem certificados de redução, a fim de que cumpris- 
sem suas cotas relativas ao esforço mundial de minimização da poluição no planeta. 
As dificuldades inerentes a esse tipo de comércio estão na atribuição de um valor ou 
quantidade que seja suficiente para compensar os custos da adaptação de todo um par- 
que industrial a essas restrições ambientais ou a acomodação de toda uma população 
sujeita às consequências do aquecimento global: secas em algumas regiões, inundação 
em outras, degelo nos polos etc. Para entender como agentes que relutam em cooperar 
com o grupo podem ser induzidos a participar desses acordos, o modelo de jogos de 
Bens Públicos são mais apropriados. 


Jogos de Bens Públicos são objetos de estudos econômicos, pelo menos desde 
1980, mas intuitivamente já eram percebidos por filósofos modernos, como Jean-Jac- 
ques Rousseau. Rousseau descreveu em “Discurso sobre a Origem e os Fundamentos da 
Desigualdade entre os Homens” (1755), o problema enfrentado por homens primitivos 
que participavam de uma caçada de veado, antes das primeiras sociedades terem se 
formado. 

Eis como puderam os homens insensivelmente adquirir certa 
ideia grosseira dos compromissos mútuos e da vantagem 
de respeitá-los, mas somente quanto poderia exigilo o 
interesse presente e evidente, posto que para eles não existiu 
a providência e, longe de se preocuparem com seu futuro 
distante, não pensavam nem mesmo no dia de amanhã. Se era 
caso de agarrar um veado, cada um sentia que para tanto devia 
ficar no seu lugar, mas se uma lebre passava ao alcance de um 
deles, não há dúvida de que ele a perseguia sem escrúpulos e, 
tendo alcançado a sua presa, pouco se lhe dava faltar a dos 
companheiros (ROUSSEAU, J-J. “Discurso sobre a Origem e 
os Fundamentos da Desigualdade entre os Homens”, 1 part., p. 


261) 


Para a caça de uma grande presa, ser bem-sucedida, é necessária a cooperação 
de todos caçadores. Como já antecipava Rousseau, se cada um se preocupar apenas 
em conseguir apenas o suficiente para o almoço, capturando uma lebre, todo grupo se 
dispersa e nada sobrará para o jantar. Situações como a caçada de veado podem ser 
descritas como um modelo de Bem Público. Jogos desse tipo ocorrem com frequência 
na natureza e entre seres humanos civilizados, sendo um exemplo básico das intera- 
ções econômicas na espécie. 


Uma das formas características de modelar-se os jogos dos Bens Públicos foi 
apresentada pelos matemáticos Christoph Hauert, Silvia de Monte, Karl Sigmund e 
Josef Hofbauer, então membros do Instituto para Matemática da Universidade de 
Viena, em 2001. A um grupo de seis jogadores é distribuído $10 para cada um. Esses 
Jogadores devem, em seguida, decidir individualmente com quanto deveram investir 
- fração da dotação ou todo montante disponível - em um fundo mútuo. Um sétimo jo- 
gador recolhe os valores, multiplica-os por três e divide o produto igualmente entre os 
seus participantes que recebem, portanto, 1/6 do saldo do rendimento de todo grupo. 


Se todos jogadores contribuírem, respectivamente, com $10, cada um receberá $30, ao 
P?, 


fina 
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Contudo, a tentação de desertar e explorar o investimento alheio é grande, tendo 
em vista o juro baixo de 0.5% para cada $1 aplicado [(1 x 3) : 6 = 0.5]. Porém, se todos 
pensarem assim, nada seria mobilizado e cada um ficaria apenas com seu $10 iniciais. 
Essa solução paradoxal é prevista pela teoria dos jogos como o equilíbrio racional de 
agentes egoístas, interessados em maximizar seus lucros e minimizar suas perdas. Não 
investir é uma solução recomendada devido ao alto risco de ser explorado. Pois, se ape- 
nas um jogador se arriscar investir tudo, enquanto os outros nada contribuem, aquele 
receberá a metade de sua aplicação, ficando só com $5 [(10 x 3) : 6 = 5], ao passo que 
os outros somariam $15 [5 + 10] *º. 

Sem embargo, apesar das restrições previstas pelos economistas, experimentos 
reais mostram, que, em geral, as pessoas investem quase a metade do capital disponí- 
vel em um jogo de um só lance. Todavia, quando o jogo é repetido por até 10 rodadas, 
inicialmente, as partes aplicam o mesmo montante do jogo de um só movimento e 
gradativamente a maioria percebe que é melhor deixar que os outros façam os inves- 
timentos, enquanto puder receber os juros sem os riscos de perda. Após uma série de 
experiências decepcionantes, os jogadores aprendem que a estratégia egoísta acaba 


tomando o lugar da cooperação inicial”, 


Em 2002, Karl Sigmund, Ernst Fehr e Martin Nowak relataram à revista Scien- 
tific American que, quando se permite a um jogador, que participou da falência de 
uma cooperação em um grupo que jogou o Bem Público, voltar a participar de um 
novo grupo de investidores, esse jogador, ao invés de reproduzir um rancoroso com- 
portamento egoísta - por causa de sua experiência passada -, recomeça cooperando 
com parte de seu capital, como na primeira vez. Outros testes revelaram que, depois 
de instituir uma punição para os desertores, as deserções caíram a uma taxa menor do 
que a observada antes. E, mesmo depois de algumas repetições, não há um declínio 
da cooperação, como ocorre nos jogos sem penalidades, mas um incremento maior no 
montante aplicado, por causa da segurança imposta pelas multas estipuladas. Impor- 
tante notar que a cobrança de multas não era sem custo para os agentes. Aquele joga- 
dor que impusesse uma penalidade ao desertor, também deveria contribuir com uma 
taxa para aplicação da sanção - uma fração da multa. Todos os valores arrecadados 
por meio desse mecanismo seriam então recolhidos e retidos pela banca. A despeito 
desse pequeno revés, os jogadores mostram-se dispostos a fazerem valer esse recurso 
quando um dos participantes contribuiu menos do que ele. À ameaça da punição inibe 
as deserções e estimula um aumento nas contribuições”. 


Em jogos repetidos, jogadores podem ver a punição como uma 
manobra astuta, investimento egoísta na educação dos outros 
Jogadores: avarentos são ensinados a contribuir para o benefí- 
cio geral. Os custos decorrentes para punir aplicações baixas 
podem produzir lucros a longo prazo (SIGMUND, K., FEHR, 
E. & NOWAK, M. “The Economics of Fair Play”, p. 87). 


Variantes dos Bens Públicos 


A forma geral dos jogos de Bens Públicos é composta por uma banca e um nú- 
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mero natural de jogadores que devem investir, em um fundo comum, uma quantia do 
montante que lhe é distribuído. O valor aplicado é multiplicado por um fator remu- 
neratório que deve ser maior que 1 e menor que o número de jogadores (1 < r < N). 
Depois, o total apurado é dividido entre os jogadores de modo igual. Cada um recebe 
então uma fração do saldo do rendimento (r/N). Essa fração é sempre menor do que 
o valor de cada unidade investida. Por causa disso, a estratégia egoísta que sugere ne- 


nhum investimento é a recomendada pela teoria econômica”. 


A punição com a imposição de uma multa é instrumento eficaz para incentivar 
a formação de uma empresa economicamente produtiva. Em geral, essa punição acar- 
reta em um custo para todos os jogadores, uma vez que a multa e a taxa de cobrança, 
respectivamente imposta ao desertor e paga pelos outros jogadores é revertida para a 
banca. Outra maneira de estimular a participação no investimento mútuo é promover 
recompensas que restituam parte da aplicação ao investidor. O mecanismo da premia- 
ção funciona da seguinte maneira: os jogadores devem responder simultaneamente se 
desejam enviar um presente aos outros jogadores. Assim, quem manda um presente 
tem um custo (c) e quem recebe, um ganho (g). O doador tem a opção de receber par- 
te de seu investimento. Quando o custo da premiação é igual ao bem produzido pela 
cooperação do outro jogador, então é interpretado como uma restituição. Nesse tipo 
de situação, podem acontecer duas coisas. Primeiro, os cooperadores podem passar a 
desertar se não recebem nenhuma recompensa. Ou, em segundo lugar, os desertores 
podem tornar-se cooperadores em função da premiação. Em todo caso, tal como na 


punição, a estratégia egoísta é não presentear ninguém, devido ao custo de fazê-lo”. 


Para que um Bem Público seja adquirido, é preciso que a soma das contribuições 
de cada jogador seja maior ou igual ao custo da sua produção. Cada um, entretanto, 
está disposto a pagar um valor que esteja abaixo ou igual ao seu preço de reserva para 
obtenção do bem comum. O preço de reserva representa o máximo que um comprador 
está disposto a pagar ou o mínimo que um vendedor pretende receber. Quando a soma 
dos preços de reserva de cada investidor é menor do que o custo da aquisição do pro- 
duto ou serviço, nenhum bem público é gerado e as partes conservam suas quantias 
iniciais que podem ser gastas no consumo de bens privados. Um bem público só será 
adquirido se a utilidade deste e os valores restantes forem maiores do que a manuten- 
ção dos valores originais sem nenhum bem público, para cada um dos investidores. 
Porém, se há o conhecimento de que o preço de reserva de um jogador é maior que o 
custo do Bem Público, os outros jogadores deverão deixar que este arque sozinho com 
a compra deste produto ou serviço, sabendo que aquela parte, se possuir riqueza su- 
ficiente, adquirirá o bem de qualquer modo. Nesses casos, a tendência é que os outros 
participantes “peguem carona” no esforço do outro em ter o bem, aproveitando-se das 
externalidades que eventualmente venham a ocorrer, já que os benefícios ou malefícios 
do consumo daquele bem público será distribuído igualmente entre todos envolvidos”. 


Punir a deserção ou premiar a cooperação são dois mecanismos alternativos, 
cujos resultados são estabilizados quando se constrói uma reputação de duro retalia- 
dor ou generoso doador. No entanto, a formação da reputação é algo que só é melhor 


avaliado em jogos do Ultimato, um caso especial do modelo de Bens Públicos, para 
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duas partes em interação com movimentos alternados. Não obstante, os experimentos 
de Sigmund, Hauert e Nowak mostraram que a premiação com reputação é menos 
estável do que a simples punição”. 


Os jogos dos Bens Públicos apresentam os aspectos cruciais de cooperação em 
sociedade. Os resultados ótimos só são obtidos se todos cooperam. Entretanto, “pegar 
carona” é uma tentação premiada, enquanto quem contribui ficar com o pagamento 
simplório. Se ninguém coopera, a punição é não usufruir de nenhum bem comum. O 
meio ambiente, a segurança social, a defesa do território nacional são ameaçados por 
esse dilema de toda uma sociedade. Uma comunidade onde prevaleçam desertores, 
agentes solitários preferem não participar do jogo e receber o pequeno pagamento de 
seu próprio esforço, independente de outros jogadores. 


Os solitários conseguem obter melhores resultados do que um grupo de deserto- 
res, embora seus ganhos sejam menores do que os dos cooperadores. Agentes solitários 
são, portanto, uma terceira alternativa estratégica intermediária, entre desertores e 
cooperadores. Os desertores são uma linha de ação que domina os cooperadores. Mas 
os solitários dominam os desertores, pois, ainda que seus ganhos sejam pequenos, não 
sofrem os custos da participação de uma sociedade com os desertores. O ciclo fecha-se 
novamente quando cooperadores dominam o ambiente dos solitários, devido a seus 
altos ganhos. Modelos dinâmicos e evolucionários dos Bens Públicos sugerem que um 
mecanismo de troca entre essas três estratégias - deserção, independência e cooperação 
-, que adapte o jogador para a situação vivida, permite sustentar o dilema social e tor- 
nar consistente o convívio entre esses tipos de agentes. Nesse sentido, a opção de par- 


ticipar da interação tornaria a cooperação possível, ao invés de fazê-la obrigatória”. 


A reciprocidade que no Dilema dos Prisioneiros chega a ser um conselho útil, 
em um jogo com muitos agentes perde força e deixa de ser uma solução viável, se não 
houver uma instância que execute as punições no lugar dos cooperadores que desejam 
aplicar uma penalidade. Os Bens Públicos colocam para um número grande de joga- 
dores, em rápida interação, a necessidade da punição ou premiação. Mas essa solução 
exige que os desertores sejam identificados. Se essa identificação não é possível, a op- 
ção de abandonar a interação com tais desertores passa a ser uma alternativa eficaz, 
pois evita a exploração e permite que a cooperação seja voluntariamente retomada, 
depois, sem uma instituição que exerça a retaliação. 


817. O Carona Free-rider 


O problema do carona (free-rider) foi objeto de discussão filosófica sob vários ân- 
gulos. Já na República - livro II -, Platão esboçou na fala de seu irmão Gláucon a descri- 
ção do comportamento de pessoas justas ou injustas submetidas a uma convenção que 
é forçada a respeitar. Ficou famosa a história fabulosa do anel de Giges, um pastor que 
achara um anel mágico capaz de tornar invisível quem o usasse voltado para palma da 
mão, recuperando a visibilidade depois de ser girado novamente para o lado externo. 
Uma vez de posse do poder da invisibilidade, alguém tomado pela ambição procuraria 
tirar vantagens cometendo toda espécie de injustiça, apoderando-se dos bens alheios, 
sem se preocupar em ser apanhado. Tal ação pareceria a mais racional possível para 
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quem tivesse usando o anel, pois atenderia sem maiores objeções aos anseios de suas 


paixões pelos bens materiais livre das restrições legais e da chance de ser capturado”. 


As ações de um egoísta consequente, tratadas de modo pioneiro por Platão, fo- 
ram retomados pelo contratualismo moderno de Thomas Hobbes, em Leviatã. Hobbes 
reapresentou e defendeu uma concepção de justiça apoiada nas leis e convenções for- 
madas por um contrato, que teria na fundação do Estado civil, a maneira mais ade- 
quada de se tornar viável. O personagem Giges ressurge no capítulo XV do Leviatã 
como o tolo que pensa na justiça como algo artificial e inexistente em seu íntimo. Ne- 
gando a validade dos pactos, os tolos consideram defensável, sempre que puderem não 
cumprir os acordos, toda vez que isso lhes trouxer benefícios”. 


Também David Hume viu as consequências de uma ausência de resposta formal 
para quem não possua nenhum sentimento moral - vergonha ou orgulho, por exemplo 
- capaz de motivá-los a agir em favor da virtude. Hume sugere haver uma espécie de 
autocontradição naquele a quem chamava de patife esperto, mas não tem, senão apela- 
do para uma fraqueza de vontade, como explicar e, por conseguinte, refutar atitudes 
egoístas a não ser defendendo a nobreza e o prazer de agir conforme a reputação de um 
homem honesto. 


Tal pessoa tem, além disso, a frequente satisfação de contem- 
plar os patifes que apesar de toda sua astúcia e habilidade, são 
traídos por suas próprias máximas e que, ainda que em seu 
propósito seja roubar de uma forma secreta e controlada, se 
surgir uma oportunidade tentadora, a natureza é frágil e caem 
na armadilha, de onde nunca conseguem sair sem a perda to- 
tal de sua reputação e de toda futura confiança e fé por parte 
da humanidade (HUME, D. Investigação sobre os Princípios da 
Moral, seç. IX, part. IL, pp. 156-157). 


Além dos filósofos mais importantes, a tentação de desertar vem sendo alvo de 
pesquisas nas áreas de conhecimento interessadas na investigação do comportamento 
humano. Aquilo que parecia atingir apenas conceituais de uma determinada corrente 
filosófica, a contratualista, revelou-se como um problema geral da conduta humana, 
ora descrito como a tragédia dos comuns, pelo biólogo Garrett Hardin, ou altruísmo 
recíproco, pelo evolucionista Robert Trivers, dilema social, pelo economista Howard 
Raiffa, entre vários autores e cientistas contemporâneos. Os jogos dos Bens Públicos 
talvez estejam a revelar os elementos definitórios comuns a todas as sociedades, desde 
a pré-história até a civilização global”. 


Enquanto o dilema dos prisioneiros procurava explicar como a cooperação pode 
emergir entre agentes egoístas que têm na deserção sua estratégia dominante, os bens 
públicos tentam mostrar como as sociedades podem se manter unidas, mesmo saben- 
do-se que os desertores, individualmente obtêm os melhores resultados da cooperação 
dos outros. No dilema dos prisioneiros, a retaliação e o comportamento recíproco fun- 
cionam graças à proximidade e o contato direto entre os dois agentes. Para promover 
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os Bens Públicos, entretanto, essa solução se torna problemática, pois o número maior 


de participantes dificulta a punição imediata. Todavia, esta punição só é eficaz se além 
de atingir com firmeza o desertor, seja também custosa aos cooperadores. Assim, para 
punir a deserção com multa, toda a cooperação deve sentir seus efeitos de um modo 
geral, fazendo com que todos esperem que tais ações não ocorram novamente. À pu- 
nição eficaz depende da identificação correta do jogador de quem se cobrará a multa. 


Um participante dos Bens Públicos sempre pode considerar que o montante apli- 
cado pelos outros é suficiente para aquisição desse bem e se satisfazer com a parte que 
usufruirá deste sem nada mais contribuir em troca. Nesse caso, ser o último a jogar 
torna-se vantajoso para quem preferir não fazer contribuição alguma quando os ou- 
tros já supriram com o necessário e não podem mais voltar atrás em suas dotações. Por 
outro lado, aqueles que foram capazes de antecipar tal movimento preferirão esperar 
que os outros contribuam em seu lugar, deixando para o último jogador o encargo pelo 
financiamento do bem comum. Jogado sequencialmente, os bens públicos transfor- 
mam-se em ultimato no qual o último jogador pode decidir ou não se pega carona ou 
recusa o fornecimento de tal produto ou serviço para todos. 


Em alguns experimentos feitos sob o modelo dos Bens Públicos, constatou-se o 
efeito pedagógico da aplicação de multas a desertores que tenham um custo para os 
cooperadores, ainda que pequeno. Os mesquinhos foram ensinados a contribuir para o 
benefício de todos. Agir contra os próprios interesses, passou então a promover maio- 
res ganhos a longo prazo. Porém, quando os grupos que aplicaram multas foram des- 
feitos e seus participantes transferidos para novos grupos formados por desconhecidos, 
onde tal regra ainda não havia sido instituída, os investimentos começaram altos e 
quando a multa se fez necessária, os “caronas” foram punidos rigorosamente. Isso 
implica que além do aspecto educacional da primeira experiência, o empenho de punir 
os transgressores produziu uma satisfação adicional proporcionada pela vingança, um 
prazer primitivo frente aos traidores submetidos. 


A vingança surge então como um sentimento moldado pela evolução que per- 
mite aos vingativos não se deixar explorar por aproveitadores em momentos difíceis 
como guerra, fome ou peste. À punição põe os infratores em uma disciplina rígida 
nessas ocasiões, onde a sobrevivência do grupo está ameaçado e a possibilidade de in- 
teração no futuro são escassas. O prazer da vingança sentida pelos indivíduos que não 
têm a consciência da implementação desse mecanismo evolutivo e a forma com que a 
espécie foi estimulada a aplicar a punição contra seus próprios interesses imediatos”! 


Sentimentos morais, como generosidade, amizade, vergonha, culpa, podem ser 
explicados por meio de raciocínios semelhantes aos que levam à vingança nos jogos de 
Bens Públicos. Portanto, teriam sido adquiridos ao longo da seleção natural, por pro- 
porcionarem um desempenho melhor na intricada rede de relacionamento social. Na 
prática, a existência de caronas, em meio a cooperadores também pode ser explicada, 
paradoxalmente, pelo êxito da cooperação. Poucos mutantes desertores teriam um 
melhor desempenho entre cooperadores do que entre semelhantes desertores. 


A Solução Filosófica para o Carona 


Cada um dos três filósofos citados antes apresentou uma solução para o proble- 
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ma dos caronas. À resposta de Hume aproxima-se da concepção evolutiva na qual a 


cooperação prevalece na sociedade por meio de um crescimento lento consolidado pelo 
hábito da obediência ou pela educação. Ademais, o sucesso momentâneo do patife es- 
perto não compensaria a perda completa de sua reputação com os prejuízos decorren- 
tes da falta de confiança que o outro lhe tinha. Logo, ao final das contas, na visão de 
Hume, o comportamento do carona seria considerado autocontraditório e, portanto, 
irracional. Embora o próprio Hume considerasse insatisfatório esse tipo de resposta ao 
agente egoísta, o apelo à racionalidade era sua última cartada contra quem não tivesse 
nenhum sentimento de culpa por seus atos imorais”, 


O largo argumento tecido por Platão, na República, aponta para a necessidade de 
se encontrar uma concepção transcendente de justiça apoiada pela fundação de uma 
sociedade em que cada um exerceria suas funções de acordo com suas aptidões na espe- 
ra de receber suas recompensas segundo seu desempenho justo. Sem ter como avaliar 
as chances de um argumento metafísico, como o platônico, funcionar em condições 
concretas, a proposta de Platão joga efetivamente a solução de problema do carona 
para um outro patamar idealista impossível de ser implementado na prática?”. 


Entrementes, é certo que a solução platônica não se alinha sinceramente à ver- 
são contratualista esboçada por seu irmão Gláucon. O contratualismo moderno foi 
fundado por Hobbes que via na posição do carona a postura de um tolo que faz um fal- 
so raciocínio de suas ações nada razoáveis contra o cumprimento do contrato. Hobbes 
considerava, com todas as letras, o comportamento do carona contrário à razão apoia- 
do no seguinte argumento: 


(...) Em primeiro lugar, quando alguém pratica uma ação que, 
na medida em que é possível prever e calcular, tendo para sua 
própria destruição, mesmo que algum acidente inesperado ve- 
nha a torná-la benéfica para ele, tais acontecimentos não a 
transformam numa ação razoável ou judiciosa. Em segundo lu- 
gar, numa condição de guerra, em que cada homem é inimigo de 
cada homem, por falta de um poder comum que os mantenha 
a todos em respeito, ninguém pode esperar ser capaz de defen- 
der-se, da destruição só com sua própria força ou inteligência, 
sem o auxílio de aliados, em alianças das quais cada um espera 
a mesma defesa. Portanto, quem declarar que considera razo- 
ável enganar aos que não pode razoavelmente esperar outros 
meios de salvação senão os que dependem de seu próprio poder. 
(...) Portanto, alguém que seja deixado fora ou expulso de uma 
sociedade está condenado a perecer, e se viver nessa sociedade 
será graças aos erros dos outros homens, os quais ele não podia 
prever e com os quais não podia contar, portanto contra a razão 
de sua preservação (HOBBES, Th. Leviatã, part. I, cap. XV, 
pp. 87-88). 


O argumento de Hobbes é claro em atacar a irracionalidade do tolo, ou carona, 
em não cumprir os pactos acertados. Hobbes pressupõe, todavia, que os agentes sejam 
capazes de retaliar ou punir sua deserção sistemática, sem recorrer a sentimentos mo- 
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rais para isso. Mas o que os jogos de Bens Públicos mostram é que, na ausência de tais 


mecanismos de controle, a escolha racional de maximizar sua utilidade recai sobre a 
deserção. Esta é a estratégia dominante no Dilema dos Prisioneiros e no Dilema Social, 
recomendada pelos teóricos economistas, apesar de gerar um equilíbrio sub-ótimo a 
todos envolvidos. Não há, portanto, que refutar o comportamento do tolo como irra- 
cional, se não houver nenhum instrumento de punição aos desertores. 


Hobbes, como todos os filósofos da tradição moderna e anterior, não conhecia 
a teoria dos jogos, embora trabalhasse os problemas comuns de modo intuitivo. Na 
situação do estado de natureza, o comportamento egoísta de quem puder explorar a 
cooperação do outro é racional, quando o dilema dos prisioneiros é jogado apenas uma 
vez e os reencontros futuros são raros. Não obstante, a solução hobbesiana imaginada 
para oferecer uma resposta aos desertores é correta: retaliar e punir. O que no caso dos 
Bens Públicos exige também a fundação de um Estado que identificasse os desertores 
e aplicasse as penalidades cabíveis. Hobbes tem razão em considerar o estado de natu- 
reza - o mundo dos desertores - um ambiente onde a vida dos indivíduos “é solitária, 
pobre, sórdida, embrutecida e curta”?”. Tem razão também em recomendar a coope- 
ração, desde que haja garantias institucionais. Mas peca em considerar irracionais as 
ações egoístas, nas condições já postas. 


Filósofos contemporâneos - entre eles, Simon Blackburn de Ruling Passions e Er- 
nst Tugendhat de Lições sobre Ética - criticam o contratualismo hobbesiano como base 
em uma visão próxima a Hume e Kant. Isso significa adotar uma postura a favor da 
formação de sentimentos morais e uma deliberação universal pela validade das ações 
morais. À falha dessa linha de raciocínio está na ausência de uma explicação do modo 
como tais sentimentos e métodos de avaliação podem ser constituídos evolutivamente, 
sem o concurso de técnicas de retaliação e tolerância ao longo da evolução. O prazer 
de sentimentos nobres só pode emergir depois que programas eficazes em identificar 
desertores e cooperadores foram incorporados por gerações daqueles que sobreviveram 
ao primeiro confronto com os trapaceiros e puderam se reproduzir em maior número. 


O consenso, considerado válido por todos os agentes, só se sustenta, sem a neces- 
sidade de intervenção estatal, na medida em que a consideração dos interesses dos en- 
volvidos se revelou capaz de, através de sucessivas iterações prévias que restringiram 
as deserções imotivadas, evitar as consequentes perdas de uma retaliação subsequente. 
Tais acordos universais sobre normas válidas surgem, portanto, depois que um altru- 
ísmo recíproco foi consolidado e não na forma de um incondicional compromisso pela 
cooperação, como exigido pelo imperativo categórico. 


A extensão do Dilema dos Prisioneiros ao Dilema Social, representado pelos 
modelos de jogos de Bens Públicos, obrigam que haja uma revisão da carga da argu- 
mentação filosófica tradicional que ainda se reproduz entre os filósofos contemporá- 
neos. Análises implementadas pelos teóricos dos jogos sobre os diversos pontos que 
influenciam a tomada de decisão em interações com um ou mais atores mostram que 
soluções simples precisam ser complementadas com novas abordagens que incorporam 
gradualmente os elementos que determinam uma escolha adequada, segundo uma 
abordagem mais complexa e próxima às condições concretas do dia a dia. O caminho 
que conduz ao detalhamento crescente dos modelos de simulações só pôde ser trilhado 
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depois que jogos mais simples foram estudados antes. Nesse sentido, a filosofia atual 


tem nos modelos oferecidos pela Teoria dos Jogos e da Cooperação as ferramentas mais 
precisas elaboradas até o momento para testar suas hipóteses e resolver aporias que se 
perpetuam ao longo dos séculos. 


O problema do carona não encontra solução definitiva em nenhuma corrente 
filosófica tradicional. Para tratar esse problema é preciso levar em conta os aspectos 
conceituais e os princípios que sustentam. Os jogos dos Bens Públicos proporcionam 
o cenário virtual adequado para que essas teorias sejam trabalhadas, a fim de que res- 
postas plausíveis sejam esboçadas em função de efetiva avaliação dos seus resultados 
em contextos, senão reais, ao menos verossímeis. 


$18. Punição e Estado 


A vigilância e a punição, funções que o contratualismo moderno atribuiu a ins- 
tituições como Estado civil, são mecanismos que surgem no modelo de jogos de Bens 
Públicos para restringir as deserções e manter estável a cooperação entre os agentes 
economicamente racionais. No processo evolutivo da espécie homo sapiens sapiens, 
sentimentos de vingança podem ter surgidos como uma forma de consolidar estraté- 
gias retaliadoras no programa que rege seu comportamento em relações que envolvam 
mais de duas partes interagindo entre si. Por outras razões que não foram a princípio 
fundadas em jogos sociais, os contratualistas defenderam a validade moral das sanções 
externas, a fim de fazer valer o cumprimento dos pactos. 


Entre filósofos contemporâneos, há sérias críticas contra soluções calcadas ape- 
nas em sanções externas para o estabelecimento da cooperação ou da condição moral 
de acordos mantidos por estes meios. O filósofo analítico Ernst Tugendhat, em Lições 
sobre Ética (1993), atacou esse estatuto da moralidade contratualista, considerado por 
ele, àquela época, no máximo, uma “quase-moral”. Isso porque, na sua concepção, 
não seria possível fundar uma consciência moral simplesmente por meio de punições 
externas. O contratualismo, assim, não teria como reivindicar tal conscientização, 
uma vez pressuposto a racionalidade instrumental de suas ações voltadas primeiro 
para a maximização da satisfação dos interesses dos agentes. 


O contratualismo anuncia uma fundamentação compreensível 
e correta, só que é fundamentado não em uma moral, mas uma 
quase-moral. Naturalmente, também não pode ser uma moral 
o que é fundamentado em caso particular - não podem existir 
no contratualismo, sendo ele consequente, juízos de valor com 
pretensão de fundamentação -, mas fundamentar-se (apenas) 
porque é bom para o indivíduo seguir tais regras. É fundamen- 
tado um ser bom relativo para cada um (TUGENDHAT, E. 
Lições sobre Ética, IV lição, p. 83). 


O que falta à sanção externa e à fundação de um Estado vigilante que imponha 
multas aos transgressores para ser forte o suficiente no sentido de fundar a moralida- 
de entre os agentes egoístas está no reconhecimento dessas medidas como boas não 
apenas para o indivíduo, que terá seu ganho incrementado pela participação forçada 
do outro na cooperação, mas para todos envolvidos. Isso exige um grau de cognição 


e racionalidade que a própria teoria dos jogos e da cooperação, a princípio, tratou de 








deixar de fora, evitando qualquer petição de princípio, com o propósito de encontrar 
as causas mais elementares para a preservação da cooperação com muitos indivíduos. 
Por ter sido a primeira teoria a tratar da punição e do Estado como elementos funda- 
mentais para formação de sociedades pacíficas, o contratualismo pode ser entendido 
agora com a corrente filosófica afim ao trato das consequências advindas das análises 
realizadas pelos modelos de jogos de Bens Públicos. 


Aos Bens Públicos, falta ainda esse aspecto contratual que permitiria às partes 
se reunir para formar um corpo jurídico que visasse a contemplar os interesses indivi- 
duais e coletivos simultaneamente. De fato, os mecanismos da punição e das recom- 
pensas atuam de modo semelhante aos objetivos apontados de forma tortuosa por 
Michel Foucault (1926-1984), em Vigiar e Punir (1975). A função a qual tais recursos 
estão voltados é a normalização de um comportamento que precisa ser controlado 
para que se atinja um empreendimento comum. 


(...) Que aquilo sobre o qual se aplicam esses dispositivos não 
são as transgressões em relação a uma lei “central”, mas em 
torno do aparelho de produção - o “comércio” e a “indústria” 
-, toda uma multiplicidade de ilegalidades, com sua diversidade 
de natureza e de origem, sem papel específico no lucro, e o des- 
tino diferente que lhes é dado pelos mecanismos punitivos. E 
que finalmente o que preside a todos esses mecanismos não é o 
funcionamento unitário de um aparelho ou de uma instituição, 
mas a necessidade de um combate e as regras de uma estratégia 


(FOUCAULT, M. Vigiar e Punir, IV part. cap. II, p. 269). 


O que está em jogo nos modelos interativos analisados pela teoria da coopera- 
ção é essa batalha surda entre interesses na sobrevivência e reprodução subjacente à 
seleção natural. Cada indivíduo emprega as estratégias que lhes são disponíveis e as 
regras melhor sucedidas passarão as gerações seguintes, perpetuando sua existência e 
normalizando suas atuações em sociedades. 


O caráter normativo da punição, denunciado por Foucault, reflete-se também nas 
estratégias adotadas pelos jogadores no contexto dos dilemas dos prisioneiros e social. 
Isso significa que, tal como Luce e Raiffa já admitiam, a teoria dos jogos pode ser um 
instrumento válido para proposições de enunciados normativos, ainda que condicio- 
nados à adequação de suas regras a um conflito de interesses real ou a pressupostos de 
racionalidade para agentes orientados pelos resultados de atitudes. No sentido exposto 
por John Harsanyi, em artigo de 1993, agentes orientados pelos resultados procuram 
seguir as regras que levam a um fim almejado e não atribuem um peso significativo, 
para suas decisões, à utilidade do processo em si, mas sim dos ganhos obtidos”. 


Antes Só, do que Mal Acompanhado 


Todo mecanismo de punição adotado nos jogos de Bens Públicos tem o propósito 
de resolver os conflitos e interesses existentes entre as partes conflitantes, da mesma 
forma como Foucault intuiu no seu famoso livro sobre a prisão. Essa guerra não de- 
clarada que subjaz a toda interação social, detectada pela teoria dos jogos e da co- 
operação, está no pano de fundo da argumentação contratualista moderna. Só que, 
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enquanto Hobbes não via uma alternativa prática fora do contrato e da possibilidade 
de se aplicar multas por meio de uma instituição, o Estado, teóricos contemporâneos, 
notadamente os matemáticos austríacos do grupo de Christoph Hauert, mostraram a 
possibilidade de transformar o dilema social em uma interação voluntária em que se 
permita a coexistência de desertores e cooperadores. Com a participação de um tercei- 
ro tipo de agente “solitário” - que tem uma possibilidade de obter seu sustento de for- 
ma independente - embora os cooperadores não dominem a maior parte da população, 
pelo menos não seriam explorados”. 


O modelo de Bens Públicos voluntário traduz o seguinte padrão cíclico de es- 
tratégias sua maioria coopera, o melhor é desertar; mas se os desertores dominam, o 
melhor é cair fora do jogo e agir sozinho, por conta própria. Porém, se os solitários pre- 
valecem, então, grupos pequenos de cooperadores podem prosperar, pois seus ganhos 
são maiores do que a média de todos grupos de estratégias. Desse modo, o jogo segue a 
dinâmica do famoso Pedra-Papel-Tesoura — apresentado na figura 1.3, onde nenhuma 
estratégia pode dominar a outra e não há um ponto de equilíbrio em estratégias puras. 
Essa dinâmica permite que a cooperação possa persistir ciclicamente, ao invés de de- 
saparecer por completo, como no jogo compulsório, sem punição. Assim, os solitários 
são um tipo de agente que protegem os cooperadores. 


No jogo dos bens públicos, a opção de cair fora permite aos 
grupos formar-se sobre uma base voluntária, e assim reiniciar 
a cooperação novamente. Mas cada jogador adicional leva a 
um retorno da diminuição e uma ameaça de incremento da ex- 
ploração. Como na terra da Rainha Vermelha [Red Queen] que 
obriga todos a correrem e se manterem no mesmo lugar. Indi- 
víduos mantêm suas estratégias ajustadas, mas a longo prazo 
não fazem melhor do que se a opção dos bens públicos nunca 
tivesse existido. Por outro lado, a participação voluntária evita 
o impasse da deserção mútua que ameaça qualquer empresa 
pública em grupos grandes (HAUERT, Chr. et al. “Volunteering 
as Red Queen Mechanism for Cooperation in Public Goods Ga- 
mes”, p.3). 


Hobbes não tinha como prever que o mecanismo da Rainha Vermelha?” de Alice 
no País do Espelho (1872), escrito dois séculos depois de seu Leviatã (1651), poderia 
resolver a guerra de todos contra todos, sem a necessidade de contratos ou da fundação 
de um Estado. Entretanto, mesmo que soubesse, talvez não ficasse satisfeito com a di- 
nâmica cíclica em que estágios de conflito, dispersão e reunião tivessem que se alternar 
infinitamente para alguma cooperação ter de prevalecer de tempos em tempos. Um 
absolutista que era, não aceitaria por certo tanto desgaste por nada. E embora tivesse 
de reconsiderar a possibilidade de uma vida solitária e autárquica não ser tão bruta e 
mesquinha como a deserção permanente, por certo, continuaria fiel à necessidade de 
punição para que fosse mantido um horizonte de oportunidade estável, sob o qual se 
poderia tecer e realizar planos de vida longos e não intermitentes. 


246 Veja HAUERT, Chr. et al. “Volunteering as Red Queen Mechanism for Cooperation in Public Goods 
Games”, p. 3. 

241 Red Queen é uma personagem de Alice no País do Espelho, de Lewis Carroll (Charles Lutwidge Dodgson, 1832-1898), 
que na adaptação brasileira de José Bento Monteiro Lobato (1882-1948) recebeu o nome de Rainha Negra (por razões gráficas). 
Veja CARROLL, L. Alice no País do Espelho, cap. II. 





Figura 6.1 - Ciclo de Predação Lotka-Volterra e 
Dinâmica Replicadora nos Bens Públicos Voluntário 
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Entrementes, caberia uma revisão à descrição da situação original do estado 
de natureza, admitindo uma alternância de estados em sistemas dinâmicos, fora do 
equilíbrio - como as observadas em sistemas complexos pela teoria do caos. Mas essa 
especulação a mais seria igualmente anacrônica. No entanto, não deixa de ser tentador 
notar as semelhanças nos gráficos resultantes da triangulação cíclica em populações 
finitas de indivíduos que alternam as três estratégias - deserção, solitária e cooperado- 
ra - e o gráfico do ciclo de Lotka-Volterra para predador e presa. O terceiro elemento, 
o solitário, provocaria o ligeiro desequilíbrio que faz da ciranda das ações um atrator 
cuja periodicidade pode ser detectada por uma seção de Poincaré”. 


Os dilemas dos prisioneiros e social permitem abrir a porta para investigações de 
outros campos interdisciplinares através de suas simulações e testes de campo, como 
se verá no último capítulo. Uma das razões para o estabelecimento dessas pontes está 
na utilização da linguagem matemática que permite o encontro de resultados equiva- 
lentes a vários campos afins: inteligência artificial, teoria do caos, biologia evolutiva, 
economia e também a ética. À solução do agente solitário vincula a dinâmica do jogo 
ao desenvolvimento cíclico de alguns eventos naturais já estudados pela física ou bio- 


logia, no controle das populações”?”. 


O solitário dos Bens Públicos voluntário corresponde à saída no DPI. Isto é, em 
um DPI, um agente coopera até que o outro jogador deserte e então sai imediatamen- 
te. À saída impede que o jogador seja explorado e age contra os desertores, impedindo 


que estes prosperem. Com isso, a mobilidade das populações pode agora ser relevante 
para o entendimento da sustentação e determinação da cooperação”. 

248 JK seção de Poincaré é um segmento de reta que atravessa o círculo traçado por um fluxo contínuo cíclico para deter- 
minar o movimento periódico de um ponto. Essa ideia foi aplicada pelo matemático francês Jules-Henri Poincaré (1857-1912) na 
tentativa de resolver o problema de um sistema envolvendo três corpos. Em uma região do espaço, imagina-se um plano trans- 
versal por onde passariam os corpos em movimento. Haveria periodicidade toda vez que a curva traçada pelo objeto retornasse 
ao mesmo ponto dessa seção. Ãos interessados em Teoria do Caos, recomenda-se a leitura da divulgação de STEWART, I. Será 
que Deus Joga Dados?. 

249 Veja LEWIN, R. Complexidades, onde se passa em revista as principais correntes teóricas dessa área de investigação. 
250 Veja AXELROD, R. “On Six Advances in Cooperation Theory”, pp. 29-31. 








De acordo com o modo como são elaboradas as estratégias, a busca por paga- 


mento mais alto pode gerar uma oscilação permanente da frequência em que as três 
estratégias - deserção, solidão e cooperação - são alternadas nos Bens Públicos Volun- 
tário. Contudo, a média de pagamento envolvida nessa troca frenética é menor do que 
o resultado ótimo da cooperação plena. A ação voluntária de sair nos Bens Públicos 
não produz necessariamente uma fixação dos cooperadores, mas proporciona um li- 
mite à deserção, prevenindo a permanência de desertores no seio da população. “São 
precisos outros mecanismos, tal como a punição para adquirir um regime estável de 
total cooperação” afirmam Franziska Michor e Martin Nowak?!. 


A despeito das objeções de Tugendhat ao contratualismo, os jogos dos Bens Pú- 
blicos têm revelado que Hobbes tinha razão. Sem o mecanismo de controle e punição 
implementado pelo Estado, esperar que a natureza incorpore ao padrão genético o 
sentimento de vergonha ou culpa que o comprometa com uma ação moralmente acei- 
tável de cumprir os acordos não resolve os problemas enfrentados pelos seres vivos em 
sua geração. Seria o mesmo que pretender que o trabalho de Sísifo tivesse fim e o rei 
da mitológica Corinto pudesse descansar de seu castigo eterno, enquanto os desertores 
procriam em meio à cooperação, sem um perdão divino. O estado de natureza pode não 
ser exatamente o mesmo descrito por Hobbes. À situação simulada no jogo voluntário 
permite a convivência de um terceiro personagem entre desertores e cooperadores, o 
solitário. Todavia, as circunstâncias continuam não sendo a melhor para todos, apesar 
de mitigada frente as condições precárias de soma zero da guerra generalizada. 


Efetivamente, a cooperação pode, em um processo longo e muito lento, surgir 
entre os organismos vivos em sua constituição celular. Genes e células que colaboram 
uns com os outros na formação de tecidos, órgãos que formam todo corpo de um ser 
vivo. Entretanto, esse mesmo organismo está sujeito a ataques de micróbios invasores 
ou mesmo mutações e mal funcionamento interno, que põem a saúde do vivente em 
perigo. Entre as espécies, a cooperação também floresceu a ponto de sociedades terem 
se formado como hoje. Nos animais capazes de formarem suas próprias leis de convi- 
vência, intuitivamente, a instituição do governo e do Estado civil veio em socorro da- 
queles que pretendiam forçar sua segurança, aumentar a expectativa de vida e poder 
realizar seus planos de vida com maiores chances de êxito. 


O mecanismo de punição faz, ainda que artificialmente, que a cooperação se 
estabeleça com maior eficiência. Nesse sentido, estimula que estratégias cooperadoras 
evoluam e se tornem estáveis ao longo do tempo, antecipando os efeitos desejáveis 
da evolução de sentimentos morais espalhados na multidão. Faz o Estado e a puni- 
ção aquilo que Immanuel Kant previa que fosse sua função: organizar a sociedade 
de demônios, a fim de garantir a paz interna e externa até que o ser humano venha a 
superar sua criminalidade e agir conforme a razão de maneira incondicionalmente boa. 


(...) O mecanismo da natureza através das inclinações egoístas, 
que se opõem entre si de modo natural também externamen- 
te, pode ser utilizado pela razão como um meio de criar espaço 
para o seu próprio fim, e regulação jurídica, e assim também, 
tanto quanto depende do próprio Estado, de fomentar e garan- 
tir a paz interna e externa (KANT, 1. 4 Paz Perpétua, B 62). 
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$19. A Cooperação nos Bens Públicos 


A reação de quem participa de jogos como os dilemas dos prisioneiros e social — 
como o Bem Público -, registrada pelo economista estadunidense Howard Raiffa, é de 
estranheza frente a situação em que se encontram. Por vezes, manifestam-se dizendo 
que deveria haver leis que impedissem tais circunstâncias virem acontecer. Em geral, 
imaginam que o erro está na estrutura do jogo e não em seus próprios comportamen- 
tos. Poucas pessoas conseguem perceber o que representa exatamente esses modelos de 
Jogos e como se mantém a cooperação, em função do maior benefício geral, enquanto, 
a maior parte dos colaboradores age por confusão ou má interpretação das regras”. 


Esses modelos simplificados funcionam no sentido de isolar os componentes que 
influenciam o comportamento dos agentes em contextos reais. Os Bens Públicos cor- 
respondem a problemas, em geral, associados com os efeitos da poluição, elaboração 
de orçamento governamental, pagamento de impostos, entre diversas outras ações in- 
dividuais que produzem resultados que afetam a todos participantes igualmente. A 
estranheza ocorre porque a simplicidade desses jogos, desprovidos de qualquer valor 
particular que as pessoas constroem para justificar seus atos, acaba revelando o com- 
portamento que muitos preferiam manter escondidos sob a máscara de pessoas dignas 
e honestas. Os modelos de jogos desmontam as histórias que muitos levam anos cons- 
truindo sobre si mesmo, fazendo florescer os seres inseguros e egoístas preocupados, 
essencialmente, em sobreviver e reproduzir. 


Os efeitos dramáticos da ação humana sobre o meio ambiente, apoiado piedo- 
samente por religiões que simplesmente consideram a espécie homo s. sapiens privile- 
giada pela criação, são resultados nefastos do comportamento detectados por essas 
singelas simulações. Todo problema levantado pelos Bens Públicos está em encontrar 
um meio para evitar que os agentes voltados para os seus próprios interesses não se 
tornem caronas, mas continuem contribuindo com os valores necessários para o provi- 
mento do bem comum. 


A teoria demonstra que voluntariamente isso não ocorre. Não obstante, há uma 
aversão bem difundida contra ser explorado e receber o pagamento simplório. Por 
conseguinte, aqueles que naturalmente cooperam devem ter disposição para punir os 
caronas, se não quiserem ser explorados, a despeito dos eventuais custos da aplicação 
dessa punição. No dilema dos prisioneiros iterado, a punição decorre da estratégia 
dominante escolhida em conjunto e a reciprocidade é exigida diretamente pelas duas 
partes envolvidas. Ampliando o número de participantes, a reciprocidade nos bens pú- 
blicos ocorre positivamente quando a contribuição dos outros estimula a colaboração 
de cada um. Porém, desde que os primeiros torneios ecológicos de DPI, se sabe que a 
cooperação mútua pode ser explorada por uma minoria egoísta que se aproveita da 
ação dos outros e nada retribui em troca, se não for retaliada. 


Sem poder retaliar diretamente ao carona, outros agentes têm como alternativa 
agir da mesma forma, negando sua participação na cooperação. Nesse caso, entre- 
tanto, as pessoas são induzidas a reproduzirem as escolhas egoístas, diminuindo sua 
cooperação inicial. Uma punição direta poderia reverter essa tendência à deserção, 
inibindo os caronas, a fim de que a cooperação não deteriorasse por completo. Os testes 


mostraram que mesmo uma minoria de cooperadores, se pudesse aplicar multas cus- 


282 Veja RAIFFA, H. El Arte y la Ciencia de la Negociación, XXV, p. 391. 








tosas à maioria de desertores, poderia fazer com que a cooperação prevalecesse, ainda 


que nenhum ganho imediato fosse obtido por aqueles que punem - já que o valor da 


multa é revertido para a banca ou simplesmente desaparece do jogo”. 


Quanto mais pesada a multa, maior a disciplina observada entre os cooperado- 
res. Assim, a punição funciona como um incentivo à cooperação e encoraja a confiança 
naqueles que desejam cooperar de boa vontade. Contudo, há um limite para multas 
muito altas, uma vez que estas acabam reduzindo o estoque de valores disponíveis 
para aplicação no fundo mútuo, pois retiram quantidades significativas dos caronas e 
parte dos bens dos cooperadores, que são obrigados a pagarem os custos da cobrança. 
No início, portanto, as quedas no rendimento são sensíveis, porém na medida em que 
os efeitos disciplinares e pedagógicos das penalidades forem sendo compreendidos, a 
tendência é haver um ganho nos pagamentos. “Para obter esses ganhos - advertem 
Fehr e Gachter - é necessário estabelecer a credibilidade plena da ameaça de punição 


com punição reais”, 


Nesse sentido, os jogos de Bens Públicos servem como aproximação para o trato 
de normas sociais a serem estabelecidas para manutenção da cooperação, além daque- 
las outras abordagens mencionadas antes. Por normas sociais, entende-se o comporta- 
mento regular sobre algo que se acredita que deva ser feito, caso contrário, uma sanção 
social informal será mobilizada. 


Assim, uma norma social pode ser pensada como um tipo de 
bem público comportamental em que cada um poderia fazer 
uma contribuição positiva - isto é, cumprir a norma social - 
também onde indivíduos precisam estar dispostos a vincular a 
norma social com sanções sociais informais, mesmo com algum 
custo imediato para si mesmo (FEHR, E. & GACHTER, S. 
“Fairness and Retaliation”, p. 9). 


Tal como na intuição do contrato hobbesiano, à norma social não se requer que 
seja explicitamente regulada. Basta que se adote um comportamento semelhante ao 
observado no relacionamento familiar, com a vizinhança ou mesmo em clubes e as- 
sociações informais. As normas sociais, dessa forma, podem reger o uso de recursos 
em um fundo mútuo, ou resolver o problema da invasão de terras e disputa entre 
latifundiários. Generalizadas na sociedade, as normas estão por trás da participação 
informal voluntária que está na base do convívio comunitário. Contudo, por ser formal 
e se aplicar a qualquer tipo de agrupamento, nem sempre as normas sociais regulam 
ações desejadas pela sociedade em geral, sobretudo quando adotada por cartéis, pelo 
crime organizado, por políticos e empresários corruptos etc. Por serem informais, sua 
validade moral depende do contexto em que é constituída, bem com da área de sua 
atuação», 


O que vale dizer que os jogos de Bens Públicos não implicam necessariamente 
na fundação de um Estado civil, como a antiga pretensão de Hobbes. Não obstante, 
exige que haja ao menos a formação de um grupo social que sirva de apoio às ações 
coordenadas de indivíduos para elaboração de uma determinada atividade, cujo fim só 


293 Veja FEHR, E. & CÂCHTER, S. “Fairness and Retaliation”, pp. 6/1. 
294 TEHR, E. & GACHTER, $. “Cooperation and Punishment in Public Goods Experiments”, p. 991. 
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pode ser atingido através da participação de mais de dois jogadores. As normas e seus 


mecanismos de punição dependem do grupo ao qual estão vinculados. A reciprocidade 
exigida decorre então de uma propriedade emergente da associação de agentes egoístas 
em torno de um fim a ser alcançado em conjunto. 


Apenas quando a quantidade de agentes excede um patamar que não é possí- 
vel aos participantes aplicarem por si mesmos as devidas sanções aos desertores, por 
causa da dificuldade de identificação dos caronas, torna-se necessária a montagem 
de um aparato externo ao grupo, com intuito de restringir ações individuais e prever 
aplicações de multas aos que não são atingidos diretamente pela retaliação do coo- 
perador. Evolutivamente, a seleção dos arranjos culturais bem-sucedidos - em geral, 
aqueles que mantêm uma forte reciprocidade entre seus membros - pode ter gerado 
as condições para que uma instituição maior fosse aceita como órgão de controle das 
diversas associações. Por conseguinte, a cooperação em sociedade foi favorecida sob 


esse aspecto””. 


Também contribuem para cooperação com muitos participantes, além do medo 
da punição, a conscientização, o hábito e fatores culturais da sociedade. Mas o fator 
evolutivo que torna a imposição de penalidades, com custo para os cooperadores, algo 
viável de ser recomendado é o prazer da vingança que se percebe na espécie Homo s. 
sapiens. Nos experimentos em que havia a mudança na formação do grupo, com os 
participantes sendo remanejados para novas associações, os associados que haviam 
tido enfrentamento com caronas antes sentiram uma especial satisfação em punir os 
novos desertores, superando até mesmo o interesse pelo desempenho econômico geral 
do fundo comum?”, 


Esse comportamento levou Karl Sigmund e colegas a suporem que “padrões éti- 
cos e sistemas morais diferem de cultura para cultura, mas nós podemos presumir que 
eles são baseados em capacidades universais enraizadas biologicamente, do mesmo 
modo que centenas de diferentes linguagens são baseadas em um universal instinto da 
linguagem”, Em última instância, ainda que nenhum desses aspectos fosse suficiente 
por si mesmo, a cooperação poderia surgir periodicamente em situações em que fosse 
possível uma participação voluntária e não compulsória. Assim, depois da deserção e 
da cooperação, essa terceira alternativa permitiria aos agentes cuidar deles mesmos, 
sem depender do outro, ou de uma associação com quem não coopera e tenta explorar 
os ganhos do fundo mútuo. 


Hora de Votar 


Outros modelos de jogos, que não a punição nos Bens Públicos, são utilizados 
para analisar a maneira pela qual os recursos podem ser alocados, no intuito de via- 
bilizar a realização de um bem comum. O sistema de votação é uma das alternativas 
mais empregadas nas sociedades democráticas. Trata-se de um mecanismo que só se 
aplica para jogos com mais de duas pessoas. E, quando a votação é feita na ausência 
de comunicação, assemelha-se a um dilema dos prisioneiros de múltiplas partes, ou o 
dilema social que foi discutido antes. 
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Uma votação pode ser descrita como um jogo na forma normal, ou estratégica, 


onde uma lista de votação corresponde às linhas de ação que serão adotadas pelos 
eleitores. Estes tem conhecimento comum de todas opções e da maneira que a votação 
da maioria determinará os resultados finais. A maioria dos votos sobre uma estratégia 
indica a forma como o bem público será ou não produzido. Se for possível haver a co- 
municação prévia entre os eleitores, então composições podem ser feitas em torno de 
um partido que defenda os interesses de seus membros. Cada jogador-eleitor procurará 


votar na estratégia que lhe for mais conveniente, maximizando sua utilidade”. 


Nessa descrição sumária, cujas variáveis podem se ajustar a circunstâncias es- 
pecíficas, quatro tipos de comportamento geral podem ser adotados. Primeiro, todos 
eleitores podem votar de acordo com uma única estratégia. Segundo, a maioria de 
eleitores pode revolver agir conforme um outro princípio que não o da minoria. Em 
terceiro, cada um pode votar segundo seus princípios particulares. Por fim, a criação 
de blocos pode formar a maioria em torno das estratégias seguida por seus membros. 
O bloco, portanto, se apropria do bem comum em favor da sua associação. Na votação 
em bloco, os eleitores individualmente podem seguir seus próprios princípios, unindo- 
se na hora do escrutínio em bancadas que componham a maioria e favoreçam os inte- 
resses dos seus participantes. Assim, o bloco diferencia-se da maioria coesa que segue o 
mesmo princípio e não necessita de nenhuma negociação para ganhar a eleição. 


Na prática, entretanto, a maioria pode se desfazer quando alguns de seus mem- 
bros aproveitam para manobrar as votações, a fim de atenderem apenas seus interesses 
particulares. Logo que essa estratégia é percebida, o grupo majoritário desaparece e 
cada um passa a votar segundo suas próprias preferências, enquanto outros blocos 
passam a ser formados. É se não há comunicação prévia, uma votação passa a caracte- 
rizar um dilema social, ou dilema dos prisioneiros multipartidário, onde a unanimida- 
de é o resultado cooperativo e o voto individualista a deserção da maioria”. 


A manipulação dos resultados em uma votação pode ser feita sem que haja ne- 
cessariamente uma fraude eleitoral. Basta apenas que o encarregado de estipular a or- 
dem do que vai ser votado em dois turnos o faça do modo que lhe for mais conveniente. 
A manipulação da pauta de votação será eficaz principalmente quando as preferências 
dos diversos partidos forem intransitivas: A > B> €C> A. Imagine, como sugere Hal 
Varian, que em um parlamento a ordem seja primeiro votar a proposta “A” e a alter- 
nativa “B”. O resultado seria a vitória de “A”. Depois, se fizesse escolher entre “A” e 
“C” - como a maioria prefere “C” a “A” (C > A) -, o resultado final desta sessão será a 
vitória de “0721, 

De outra maneira, caso se votasse em primeiro turno “C” contra “A” e, em se- 
guida, a vitoriosa “C” contra “B”, o resultado final seria o sufrágio de “B” (B > C). O 
único modo da opção “A” vencer seria primeiro propor a votação entre “B” e “C” para 
depois colocar “A” na disputa com “B”. O resultado final seria a esperada vitória de 
“A” (A > B). A manipulação do resultado por um agendador sagaz é inevitável quando 
as preferências da maioria das pessoas não é transitiva. À intransitividade das prefe- 
rências, que para muitos caracteriza uma irracionalidade ou, pelo menos, fraqueza de 
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vontade no indivíduo, foi detectada nos experimentos de Maurice Allais, nos quais as 


pessoas tinham de fazer suas escolhas em ambientes de incerteza??. Entretanto, no 
contexto social não é possível falar de irracionalidade da maioria, pois mesmo que 
cada indivíduo mantivesse suas preferências transitivas, ainda assim seria possível ao 
grupo formar preferências circulares. 


Por conta do “paradoxo dos eleitores”, frequentemente, os resultados das elei- 
ções geram uma insatisfação e ineficiência na produção de um bem público, devido à 
inconsistência de uma maioria dotada de preferências manipuláveis. A impossibilida- 
de de solucionar esse problema de determinação das preferências da maioria foi apre- 
sentado com clareza pela primeira vez por Edward John Nanson (1850-1936), no livro 
Transactions and Proceedings of the Royal Society of Victoria (Processos e Transações da 
Sociedade Real de Vitória, 1882). O problema decorre do fato de um grupo preferir À a 
B; outro preferir B a C e um terceiro C a A. Individualmente, as preferências de cada 
eleitor podem até ser coerentes e transitivas, mas as escolhas que fazem socialmente 
não são. Disto resulta que o conselho de orientar as pessoas a seguirem sua ordem de 
preferência nem sempre determina a vontade de toda sociedade. 


Em consequência disso, o economista Kenneth Joseph Arrow demonstrou seu 
famoso teorema de Bem-Estar Social como a inviabilidade de se descobrir uma relação 
de preferências da sociedade que satisfizesse as seguintes condições: 


1. A partir das preferências individuais, para uma função de bem-estar social 
garantir a preferência A sobre B, então esta função deve sempre favorecer A, se uma 
nova relação de preferências dos indivíduos fizer de A mais preferida do que antes; 


2. Quando A for parte do conjunto total de alternativas, se todos indivíduos pre- 
ferirem A a B, a sociedade preferirá sempre A; 


3. Existe sempre um padrão de preferência do indivíduo que fará a sociedade 
escolher uma alternativa existente entre seus membros; 


4. Nenhum indivíduo pode ditar as suas preferências como sendo aquelas que a 
sociedade deve seguir. 


Não há uma função social que atenda essas quatro restrições, pois se uma socie- 
dade preferir A a B, a despeito das preferências individuais, então não haveria necessi- 
dade de se levar o grupo à votação. Por outro lado, tal escolha também seria desneces- 
sária se uma só pessoa fosse capaz de determinar o que a sociedade deve escolher, como 
no caso de uma ditadura. Portanto, nenhum indivíduo poderia gerar as preferências de 
uma sociedade, nem estas poderiam ser formadas pela vontade da maioria de votantes, 
daí a impossibilidade do bem-estar social se basear em preferências individuais. O que 
faz da eleição um mecanismo pouco eficiente. 
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Capítulo Z 
Ultimato 


Nº modelo dos Bens Públicos, tem-se a extensão adequada do Dilema dos Prisio- 
neiros para dilemas sociais, onde mais de duas partes devem decidir entre coope- 
rar ou não em um empreendimento comum. Com muitos jogadores envolvidos, os Bens 
Públicos mostram a necessidade de se ter um instrumento para impedir que desertores 
permaneçam explorando a cooperação na ausência de uma punição direta pela re- 
taliação recíproca entre as partes. Se, devido à distância entre os diversos agentes, a 
reciprocidade forte não pode ser efetuada, o que os Bens Públicos ensinam é que haja 
a instituição de um mecanismo que fiscalize e aplique as penalidades convenientes, a 
fim de inibir a deserção e permitir que a cooperação seja estabilizada. 


Amiúde, os modelos de Bens Públicos são implementados por meio de decisões 
tomadas simultaneamente entre os agentes, podendo ser repetido por várias rodadas. 
Uma outra maneira de aplicar esse modelo de jogo a uma dinâmica de movimentos al- 
ternados com dois jogadores é transformá-lo em Ultimato. O jogo do Ultimato tem sua 
invenção relacionada com o aparecimento do artigo dos economistas alemães Werner 
Giuth, Rolf Schmittberger e Bernd Schwarze, de 1982, intitulado “An Experimental 
Analysis of Ultimatum Bargaining” (“Uma Análise Experimental da Negociação do 
Ultimato”). Trata-se, o Ultimato, de Bens Públicos simplificado, onde a banca oferece 
uma quantia fixa a dois jogadores que devem decidir como dividi-la entre si. O pri- 
meiro jogador (o líder) deve então fazer uma proposta de divisão ao segundo jogador 
(o receptor), que, por sua vez, deve responder se a aceita ou não. Caso aceite a oferta o 
dinheiro é distribuído da maneira que foi sugerida pelo líder. De outro modo, a rejeição 
implica na devolução de todo o montante à banca que nada disponibiliza para ambos. 


No modelo do Ultimato, uma oferta alta da parte do líder significa um prêmio 
de estímulo à cooperação do outro. Em outras palavras, o benefício que o receptor 
obtém é igual ao custo da doação feita pelo líder. Por outro lado, ofertas irrisórias são 
passíveis de punição pelo receptor. O custo da recusa, para este, equivale à taxa paga à 
banca, nos Bens Públicos, para aplicar uma multa maior ao líder - tão grande quanto 
o valor que este pretendia alcançar. Entre agentes egoístas racionais, a teoria dos jogos 


prevê que uma proposta de 99% para o primeiro jogador e 1% para o segundo deveria 








ser feita pelo líder e aceita pelo receptor. 


A razão dessa escolha ser considerada a mais racional está no fato do jogador 
A (o “líder”) saber que a “folha” onde se encontra o resultado (99, 1) representa um 
equilíbrio perfeito para essa pequena árvore, segundo a indução reversa (Figura 7.1). 
Na forma estratégica, ou normal (Matriz), percebe-se também que a estratégia “b” do- 


mina fracamente a opção “a” 


do Receptor (jogador II), quando o Líder escolhe “B” e 
fortemente, quando este joga “A”. De qualquer modo, o Receptor é o único que possui 
uma estratégia dominante e o Líder pode explorar essa circunstância se souber que o 
outro é um agente racional. Se esse for o caso, o Líder não teria porque temer um des- 
vio para “a”, posto que dos dois equilíbrios de Nash existentes nessa matriz, restaria 
apenas o equilíbrio perfeito a ser escolhido depois da escolha de “A”. Na forma normal 


ou extensiva, a recomendação para o primeiro jogador é optar por “A”. 


Figura 7.1 - Jogo do Ultimato (Padrão) Matriz do Ultimato 
Coluna (II) 


SETE a (9) 
0,0 199,1 c 
150, 50 50, 50 c 










(50, 50) (99, 1) 


Contudo, não é isso que ocorre na maioria dos testes realizados com pessoas em 
laboratório e em campo. De acordo com Hal Varian, experiências feitas com estudan- 
tes estadunidenses apresentaram ofertas para o receptor em torno dos 45% do total. 
Ofertas estas que eram, em geral, bem-sucedidas?*. O Ultimato é jogado, geralmente, 
em uma só rodada com ofertas protegidas pelo anonimato. Porém, se é permitido ao 
Líder saber que tipo de receptor enfrentará, alguns fatores importantes para compre- 
ensão dessas ofertas fora do padrão teórico podem ser detectados. Se o Receptor for 
alguém incapaz de punir ou tenha a reputação de pessoa fria e racional, a tentação de 
desertar aumenta. Por outro lado, se o histórico do Receptor for de uma pessoa emoti- 
va e pronta a manter sua fama de negociador “duro”, o melhor talvez seja propor uma 
divisão mais equitativa próxima do equilíbrio imperfeito, mas justo. 


Enquanto os líderes fizerem ofertas com o objetivo de maximizarem seu ganho, 
conforme a possibilidade de rejeição, as previsões dos teóricos estão salvas. O problema 
surge a partir do comportamento do receptor em não aceitar nenhum valor maior do 
que zero. A explicação que vem sendo fornecida por dezenas de trabalhos realizados 
em torno do Ultimato tem apelado para inclusão de reações psicológicas, consolidadas 
durante o processo de evolução da espécie Homo s. sapiens, no cerne de seus diagnós- 
ticos teóricos. 


A aparente irracionalidade humana em oferecer e pretender uma divisão justa 
indica que algo mais está em jogo no Ultimato do que apenas maximizar a utilidade 
de interesses pessoais imediatos. O motivo mais provável talvez seja o fato das pessoas 
entenderem o jogo como parte de uma interação que pode ser repetida outras vezes, 
mesmo quando se afirma expressamente que o jogo será realizado em uma única ro- 
dada. As pessoas sabem por experiência própria que atitudes grosseiramente injustas 
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são passíveis de retaliação. Para evitar o risco de rejeição, procuram fazer propostas 


razoáveis, do ponto de vista partilhado por sua comunidade. Dessa forma, tanto líde- 
res, como receptores, conseguem manter sua reputação de bons negociadores, entre os 
seus. 


A recusa de propostas baixas tem um pequeno custo para o Receptor e um alto 
preço pago pelo Líder. Entretanto, a reputação construída de não oferecer nem aceitar 
“esmolas” favorece maiores ganhos no futuro, ao mesmo tempo que inibe tentativas de 
estabelecer uma distribuição desigual de recursos. A forma pura do Jogo do Ultimato 
simplifica muito a realidade cotidiana, ao evitar que haja uma contraoferta, através 
da qual as pessoas poderiam obter informações umas das outras, desaparecendo e en- 
cerrando a negociação caso a divisão permanecesse desequilibrada, a ponto de não ser 
considerada válida. Não obstante, tais limitações permitem que se avalie exatamente 
quais são os fatores que estão influenciando as deliberações, mudando aqui ou ali as 
variáveis que forem mais relevantes para análise. 


Tais restrições, ao invés de serem desvantajosas, deixam-nos 
estudar o comportamento humano em situações bem definidas, 
descobrindo os princípios fundamentais que governam nosso 
mecanismo de tomada de decisão. O processo é algo de seme- 
lhante às colisões de partículas da física no vácuo, voltados 


para o estudo de suas propriedades (SIGMUND, K., FEHR, 
E., NOWAK, M. A. “The Economics of Fair Play”, p. 84). 


O jogo do Ultimato vem sendo aplicado por neurocientistas atentos que buscam 
localizar na atividade cerebral as áreas responsáveis pelo processo de decisão - obser- 
vados por meio de tomógrafos computadorizados. Entre agentes humanos, o pleno co- 
nhecimento dos tipos que participam do Ultimato leva os jogadores a se comportarem 
de acordo com a norma social que manda cooperar e punir os desertores. Ao passo que, 
quando as ofertas são feitas por uma máquina, os receptores tendem a aceitar volumes 
mais baixos de dinheiro ao contrário do que geralmente se observa entre dois huma- 
nos. Destarte, as propostas dirigidas a computadores são as mais desiguais possíveis”. 


O sentimento de vingança que aflora no jogo dos Bens Públicos aparece no Ulti- 
mato acompanhado pela indignação de ter sido alvo de um desertor. Nesses dois casos, 
a vingança é definida por um custo ou risco que alguém tem de correr para impor 
uma penalidade a quem obteve ou quer obter uma vantagem sobre a boa vontade do 
agente em cooperar. À vingança é um sentimento moral internalizado que emerge na- 
turalmente pelo desejo de impor um sofrimento a outra pessoa ou objeto que lhe tenha 
causado algum dano. Tal reação teria sido consolidada pela evolução no repertório de 
estratégias inatas a serem acionadas sempre que o sujeito se sentir prejudicado. Como 
afirma o sociólogo norueguês Jon Elster, “esse tipo de comportamento é universal”&, 


Uma norma social é um outro mecanismo à disposição das pessoas, a fim de po- 
derem incorporar o sentimento de vingança ao de justiça presente em muitas formas 
de organização da sociedade, tais como a vendeita dos mafiosos. Assim, como nos Bens 
Públicos e no Dilema dos Prisioneiros, a capacidade de retaliação permite que o medo 
de uma sanção externa acabe por gerar maiores prejuízos no Ultimato. O medo da 
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vingança é suficiente para explicar porque as pessoas evitam uma divisão injusta, a 


despeito dos seus interesses pessoais. Isso reforça o argumento de Hobbes e rebate as 
objeções de Tugendhat, acerca do estatuto moral do contratualismo?º. 


Implicações do Ultimato 


Toda essa discussão sobre os sentimentos envolvidos na situação de ultimato pro- 
voca, ao menos, duas posições extremas e contrárias. Uma que considera necessário, 
para considerações éticas, que tais sentimentos estejam incorporados no indivíduo, a 
fim de florescer uma conscientização que reconheça as sanções externas como sendo 
algo com valor moral para expiação de suas culpa e vergonha, sentidos em foro íntimo. 
Outra posição argumenta que tais sentimentos pouca utilidade têm na satisfação de 
critérios de racionalidade, no momento em que se precisa tomar uma decisão sobre a 
conduta a ser adotada. De fato, reações baseadas em regras preconcebidas e instaladas 
no agente serão de alcance reduzido se não permitirem que estas sejam capazes de se 
adaptarem às circunstâncias novas que não estavam prevista pela programação pré- 
via. 


Jogos como Ultimato, Bens Públicos e Dilema dos Prisioneiros têm indicado que 
programas muito simples facilitam a vida do programador, mas dificultam a adapta- 
ção a ambientes mais complexos. As simplificações são úteis para ajudar a compreen- 
der quais são os ingredientes fundamentais das interações, sem, no entanto, autorizar 
qualquer avanço sobre o modo como as pessoas deverão agir necessariamente dadas 
certas condições. O que não quer dizer que esses estudos sejam de todo vedados a 
proposições normativas acerca de linhas de ação recomendáveis para determinadas 
circunstâncias. Na Alemanha, dois pesquisadores do Instituto Max Planck para Pes- 
quisa Psicológica, Peter M. Todd e Bernhard Borges, analisaram o papel da racionali- 
dade e o grau de complexidade suficiente para agentes que pudessem ser considerados 
socialmente inteligentes, a partir do jogo do Ultimato. Confrontaram propostas de 
alguns autores que defendiam a inclusão de uma capacidade de aprendizagem por 
reforço e de outros que sustentavam ser o raciocínio dedutivo necessário não só para 
compreensão dos problemas reais, mas também para imaginar os futuros obstáculos. 
Discutiram, ainda, as hipóteses contrárias à utilidade de um lento processo que, ao 
invés de ajudar, dificultaria as tomadas de decisão. Posto que os resultados obtidos 
pelos agentes capazes de aprender com o reforço de experiências anteriores e prever 
novas ações seriam algo externo à teoria dos jogos e que não faria parte de ser escopo 
de investigação”. 


Por sua vez, Todd e Borges não consideram essa objeção à racionalidade defini- 
tiva. Para esses autores, o importante seria definir que tipo de raciocínio deveria ser 
acrescentado aos agentes sociais a fim de que estes pudessem resolver problemas como 
o do Ultimato. A maneira como seres humanos têm reagido às ofertas do ultimato 
estão próximas daquela adquirida por agentes dotados de uma regra de raciocínio 
behaviorista de aprendizagem por reforço. Ao lado da regra de reforço, acrescenta-se o 
raciocínio lógico que proporciona a cada um a capacidade de inferir as respostas do 
Receptor, a partir de informações sobre sua aceitação das propostas anteriores. Assim, 
com base nesses dados, poder-se-ia antecipar suas reações futuras em situações seme- 


266 Ver HOBBES, T. Leviatã, 1 part. cap. XV, p.94 e TUGENDHAT, E. Lições sobre Ética, IV liç., p.83. 
267 TODD, BM. & BORGES, B. “Designing Socially Intelligent Agents for the Ultimatum Game”, p. 135. 








lhantes. Mantidas as mesmas condições, maiores seriam as chances de uma proposta 


igual ou maior à historicamente aceita ser também bem-sucedida. 


Essa mistura de raciocínio e aprendizagem, ao invés de sustentar o Ultimato 
na forma prevista pelos teóricos dos jogos, com o tempo, encaminharia os resultados 
para o comportamento similar àquele observado entre humanos que participam de 
experimentos com esse tipo de jogo - próximo da divisão equitativa meio a meio. Tal 
fuga da solução perfeita (99, 1) dever-se-ia ao acréscimo do raciocínio que antecipa os 
resultados na forma da regra lógica que manda subir os valores ofertados, em vez de 
mantê-los fixos, apoiados na suposição de que a aceitação de uma oferta baixa implica 
em uma regra do tipo “aceitar qualquer coisa”. O fundamento dessa regra lógica está 
no fato de que se uma proposta foi aceita antes, uma oferta posterior um pouco maior 
deverá necessariamente de ser aceita, se nenhum fato relevante tiver sido alterado. 


Contudo, interpretações behavioristas pessimistas considerariam esse tipo de 
acréscimo de raciocínio prejudicial aos resultados ótimos do líder, pois reduziria cada 
vez mais os seus ganhos a cada nova oferta. Sendo assim, a inferência acrescentada ao 
ensino geraria resultados piores e distorceria o aprendizado. Não obstante, a conclu- 
são pessimista dos behavioristas que considera irrelevante a inclusão do raciocínio à 
aprendizagem por reforço só se sustenta se o ambiente no qual Líder e Receptor to- 
mam suas decisões se mantiver sempre como está sem perturbações. Entretanto, para 
cenários dinâmicos, o processo de adaptação aparece com maior complexidade e não 
se deverá considerar apenas as propostas ótimas para o Líder, mas a probabilidade de 
recebimento de respostas negativas do Receptor como uma estratégia para elevar os 
ganhos futuros. Nesse cenário estratégico, que considera as reações do outro, agentes 
que atuassem apenas por reforço teriam os piores resultados se não levassem em conta 
a possibilidade de aumentar suas ofertas como um indivíduo que raciocina e aprende. 
A inclusão do raciocínio na aprendizagem torna mais flexível e rápida a adaptação 
da oferta a novas situações, prevenindo respostas negativas, o que não seria possível 
agindo apenas por estímulo e reforço. 


[Em estudos complementares temos considerado os efeitos da 
coevolução entre estratégias de ofertas e aceitação com nossa 
gama total de estratégias de raciocínio-mais-aprendizagem, e 
descobrimos mais uma vez que o complexo processo de coa- 
daptação pode levar agentes ao comportamento do tipo huma- 
no em jogos do ultimato, mas muito mais rapidamente do que 
poderiam apenas aprendendo por reforço. Talvez seja o caso 
quando pretendemos modelar o nível humano de inteligência 
social em jogos simples, adicionando o tipo certo de raciocínio 
que podem gerar ganhos rápidos (TODD, P M. & BORGES, B. 
“Designing Socially Intelligent Agents for the Ultimatum Game”, 
p. 136). 


Uma variante radical do Ultimato permite avaliar até onde vai a generosidade do 
líder. O denominado jogo do Ditador dá ao Líder a oportunidade de dividir os valores 
da maneira que achar melhor, enquanto o Receptor só pode aceitá-la, sem jamais re- 
cusar. Nesse caso, não haveria então que temer qualquer punição para ofertas egoístas, 


uma vez que não cabe a rejeição por parte do outro. Mesmo assim, as partilhas ficam 








longe da previsão teórica e perto da divisão equitativa. Não tanto como no Ultimato, 
mas razoáveis, pelo que se poderia esperar. Novamente, a explicação para esse tipo 
de comportamento recai sobre a reputação que o líder tenta construir. Pois, a fama 
de “mesquinho” e mau cooperador poderia lhe prejudicar no futuro. Essa conclusão 
é reforçada pelos resultados obtidos em uma versão ainda mais radical chamada de 
Ditador Duplo-Cego. Aqui as ofertas são feitas sem que o Receptor e experimentador 
saibam quem fez a proposta. Só assim, protegido pelo duplo anonimato, o comporta- 
mento egoísta finalmente aparece e o Líder, em geral, fica com tudo para s?*. 


Também há uma outra versão do Ultimato híbrida ao Bens Públicos que pro- 
cura capturar a reciprocidade positiva através do Jogo da Confiança. Neste modelo, o 
Líder propõe a sua divisão e a banca tripla o valor destinado ao Receptor que deve de- 
cidir se devolve parte ou tudo que recebeu ao Líder. Agora, o que acontece na maioria 
dos casos é o envio do dinheiro por parte dos líderes e a devolução de alguma quantia 
por parte dos receptores, independente do montante envolvido. A reciprocidade é en- 
tendida como resposta de um jogador a uma ação que foi feita pelo outro sem esperar 
nenhum ganho imediato, em favor da cooperação ou deserção. No jogo do Ultimato, a 
punição da recusa corresponde à reciprocidade negativa, observada em testes realiza- 
dos por várias culturas distintas. Enquanto, a reciprocidade positiva aparece estam- 


pada nas restituições dos valores feitos no jogo da Confiança”. 


$20. Um Teste de Thomas Schelling 


No começo da moderna teoria dos jogos, foram lançados muitos livros que logo se 
tornaram clássicos contemporâneos da matéria. Ao lado do inaugural Theory of Games 
and Behavior Economics (1947), de Von Neumann e Morgenstern, podem ser listados 
Games and Decision (1957), de Luce e Raiffa, Theory of Games as a Tool for the Moral 
Philosopher (1955), de Richard Bevan Braithwaite e Lutas, Jogos e Debates, de Anatol 
Rapoport, entre outros. Muitos desses livros continham informações específicas do 
contexto em que foram redigidos, no auge da Guerra Fria. Mesmo assim, as hipóteses 
gerais que estavam subjacentes a eles permaneceram como uma contribuição perene e 
como fonte inspiradora de teses que foram atualizadas depois. É o caso de The Strategy 
of Conflict, de Thomas C. Schelling, com edições publicadas entre os anos 1959 e 1963. 


Esse livro trouxe uma ampla análise sobre as tensas relações internacionais de 
seu tempo. Forneceu também as bases do estudo de jogos de coordenação e do papel da 
comunicação, implícita ou explícita, na solução de situações em que as ações precisam 
chegar a um ponto focal que satisfaça os interesses de ambos encontrarem um lugar- 
comum para poderem realizar seus ganhos, impossíveis de serem alcançados por um 
agente solitário. O conceito de “ponto focal” foi determinado a partir de uma série de 
exemplos imaginados, onde indivíduos com interesses divergentes precisavam escolher 
uma estratégia adequada para satisfazê-los, sendo obrigados a levarem em conta os 
interesses dos outros, a fim de serem bem-sucedidos. 


Entre diversos experimentos apresentados no terceiro capítulo de seu livro, Tho- 
mas Schelling imaginou um em que dois jogadores estavam na condição de terem de 
dividir uma quantia em dinheiro (8100) em duas partes, tal como no jogo do Ultimato. 


266 Veja HENRICH, ]. et al. “In Search of Homo Economicus”, 1, p. 15 e PINKER, St. Tabula Rasa, cap. 14, p. 351. 
269 Veja FEHR, E. & GACHTER, S. “Fairness and Retaliation”, in Journal of Economic Perspective, nº 14, pp. 
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Contudo, diferente deste, os dois estavam isolados e tinham de fazer suas propostas si- 


multaneamente, sem nenhuma forma de comunicação entre eles. Cada uma das partes 
se via então envolvido em uma negociação tácita entre si, em que ambos tinham de 
coordenar suas ações com base em interesses, ao mesmo tempo, comuns e divergentes. 
Devido à simetria existente, a divisão teria de ser igual, caso contrário, ninguém rece- 


beria nada”. 


Na ausência de comunicação, jogadores são obrigados a observar o ponto de 
vista dos outros e a proporem uma solução que considere os interesses dos envolvidos 
igualmente. O resultado meio a meio que, no jogo do ultimato original, surge apenas 
como uma hipótese que não está em equilíbrio perfeito, no teste sugerido por Schelling, 
aparece como uma “dica” matemática na qual os participantes reconhecem sua vali- 
dade para aquela ocasião. Mas isso é apenas um artifício matemático para jogadores 
que não podem se comunicar e saibam ao menos operar uma divisão corretamente. 
A igualdade da decisão resulta do conhecimento que as pessoas têm de que o outro, 
se for como o agente, quererá maximizar os seus ganhos do mesmo modo. Por conta 
disso, não desejará obter ganhos menores do que a metade que estaria disponível na 
distribuição de um bem entre indivíduos com a mesma constituição. O ponto focal desse 
tipo de jogo recai sobre a repartição justa. É é lá que os rivais devem se encontrar caso 
queiram satisfazer seus interesses, em parte opostos, em parte convergentes. Devem, 
então, coordenar suas ações para esse objetivo, embora os resultados lhes sejam sub-ó- 


timos”!. 


O ponto focal descoberto por Schelling em jogos de coordenação representa a so- 
lução dos problemas apresentados nesses modelos de situações. Trata-se de uma marca 
notória que é reconhecida pelos participantes como sendo adequada para o encontro 
das ações de cada um. No caso da negociação explícita, como o Ultimato, essa repre- 
sentação acaba por influenciar a orientação da solução que os jogadores devem ado- 
tar. E o acordo último, no qual os participantes não podem mais recusar o acordo. A 
intuição do ponto focal acrescenta um detalhe a mais às outras explicações oferecidas 
pelos pesquisadores sobre os resultados fora do equilíbrio perfeito no jogo do Ultimato. 


(...) O resultado final precisa ser um ponto do qual ninguém es- 
pere que o outro recuse, enquanto o principal ingrediente dessa 
expectativa é que um pensa que o outro espera que o primeiro 
espera e assim por diante. De certo modo, fora desta situação 
fluida e indeterminada que aparentemente não prova nenhuma 
razão lógica para ninguém esperar alguma expectativa que se 
espera ser esperada por esperar, uma decisão é requerida. Essa 
expectativa infinitamente reflexiva precisa de alguma forma 
convergir para um ponto único, ao qual cada um espera que o 
outro não espera ser recusado (SCHELLING, Th. C. The Stra- 
tegy of Conflict, cap. 3, p. 70). 


A racionalidade do ponto focal está em busca de um lugar que satisfaça a inces- 
sante cadeia do pensamento recursivo entre pessoas que tenham conhecimento comum 
sobre os tipos que participam da interação. Esse argumento de racionalidade estraté- 
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gica depende entretanto de uma suposição forte de que haja, entre aqueles que se vai 


encontrar, a possibilidade real do outro ser alguém que procura maximizar seus ganhos 
como o próprio agente. 


Porém, se a informação partilhada for de que o outro possa ser considerado irra- 
cional e que não visa o melhor para si, a dificuldade imposta pela ausência de comuni- 
cação ao ultimato está em saber agora em que ponto de divisão entre os dois jogadores 
será bem-sucedida. Ainda que o agente quisesse tirar vantagem de sua informação 
sobre o tipo de irracionalidade do outro, não poderia fugir da orientação matemática, 
devido à impossibilidade de saber qual resultado seria mencionado. 


Independente da racionalidade atribuída aos agentes, a divisão simultânea e sem 
comunicação faz da solução matemática a única resposta plausível de ser aconselhada. 
À existência de um ponto focal no jogo do Ultimato traz alguma complicação ao argu- 
mento que defende a retaliação e a vingança como aspectos cruciais para a tendência 
de pessoas oferecerem e aceitarem propostas de divisão justa entre as partes. Do ponto 
de vista do experimento de Schelling, a escolha do ponto focal meio a meio resulta da 
procura de um marco que oriente as ações dos agentes em função de um objetivo que os 
livre do pensamento recursivo. Mas agora, jogado sequencialmente, a teoria dos jogos 
sugere que as opções atendam ao ponto de equilíbrio perfeito e não ao foco racional. E, 
no entanto, seres humanos parecem dividir próximos à solução intuitiva de Schelling, 
ao contrário do que previa as conclusões teóricas. 


Isso significa que, ao invés de estarem preocupados com a punição que o outro 
lhe faz para vingar uma proposta egoísta, o jogador que propõe uma repartição perto 
do ponto focal, pode estar tentando tirar vantagem da tolerância do receptor ao desvio 
dos valores que talvez tivesse em mente se a oferta de divisão fosse feita simultane- 
amente. Assim sendo, não seria necessário buscar uma explicação fora do âmbito da 
matemática ou da psicologia da racionalidade estratégica para entender tal atitude. 
Principalmente, quando tais negociações são feitas em um primeiro contato entre os 
Jogadores que não têm informação recíproca um sobre o outro, além do conhecimento 
comum de que ambos deverão agir racionalmente. À diferença entre o jogo simultâneo 
e sem comunicação, para o ultimato está apenas na alternância de movimentos de 
oferta e contraoferta. Realizado em dois lances, a negociação estimula propostas arris- 
cadas que explorem a margem de erro em torno da solução matemática do ponto focal. 


Ao contrário de se imaginar que o líder suspeite da irracionalidade do outro re- 
cusar sua sugestão, ao fazer uma proposta equitativa, de fato ele poderá testar a sua 
racionalidade em preferir divisões diferentes do meio a meio. Mas não tão longe que 
possa ofender sua presumida inteligência. A existência de um ponto focal alterar ligei- 
ramente o enfoque das pesquisas feitas sobre a conduta baseada no ultimato. 


(...) Alguém há de ter razão por fincar fortemente sobre uma 
posição, e ao longo do contínuo de posições qualitativamente 
indiferenciáveis, ninguém encontra racionalidade. O racional 
pode não ser forte em um “ponto focal” arbitrário, mas ao me- 
nos ele pode defender-se com o argumento “se não aqui, então 


onde?”(SCHELLING, T.Op.cit., idem). 


O jogo do Ultimato, jogado simultaneamente, torna-se um jogo de coordenação 








das ações, por causa da ausência de comunicação. Desta forma, pouco importa se os 


Jogadores são rivais ou companheiros, pois o objetivo é encontrar um lugar onde todos 
possam fazer a partilha do bem disponível. Depois de descobrir essa posição, não há 
como os jogadores deixarem de ir para lá, sem que isso incorra em prejuízo para as par- 
tes. No modo alternado, próprio do Ultimato, o ponto focal perde parte de seu poder 
de atração, mas continua agindo como se fosse uma referência, na falta de uma outra 
razão que oriente as ações dos envolvidos. Passa então a coordenar as expectativas de 
cada um, no intuito de encontrar um resultado satisfatório. 


A negociação tácita entre dois jogadores que se enfrentam no Ultimato também 
requer suposições, manobras e comunicação indireta do mesmo modo que em outros 
tipos de barganha. A divisão igual, ou em torno desta, sustenta-se sobre vários ar- 
gumentos plausíveis em seu favor. À primeira vista, representa o conceito de justiça 
partilhado por uma sociedade. Reflete ainda um equilíbrio no poder de barganha de 
participantes de uma mesma categoria, isto é simetria. Ou, pelo menos, mostra como 
cada um avalia a estimativa do outro. Em todo caso, a suposta justiça dessas escolhas 
coordenadas seriam reforçadas pela tentativa de evitar os efeitos contrários a um acor- 
do que a indeterminação ou insegurança poderiam provocar??, 


Dessa perspectiva, a tendência para repartições “justas”, no Ultimato, não se- 
ria fortemente afetada apenas por se tratar de um jogo, onde as propostas são feitas 
claramente e com alternância. Em última instância, não seria necessário recorrer a 
hipóteses distantes da maneira como a racionalidade opera nas circunstâncias do jogo, 
para explicar a necessidade de se chegar a um lugar perto das expectativas partilhadas 
por todos. A proposta “justa” funcionaria, portanto, como um sinal de referência para 
um possível encontro entre as partes. Com isso, não seria preciso descer abaixo do nível 
cognitivo, pressupondo a atuação decisiva de sentimentos inatos ou de um comporta- 
mento consolidado pela evolução. Afinal, para que tais sentimentos e comportamentos 
inatos surgissem, seria necessário primeiro encontrar a solução para depois passá-la às 
futuras gerações. Esta solução aparece sempre que o jogo é apresentado, bastando ape- 
nas um mínimo de racionalidade reflexiva que permita a localização do ponto focal. 


(...) [O] ponto focal pode certamente ser diferente quando fa- 
lar é permitido (...) Mas este que pode ser o meio principal na 
negociação tácita, aparentemente pode ser ao menos um dos 
princípios importantes na análise da negociação explícita. E, 
desde que as famosas barganhas “explícitas” incluam mano- 
bras, comunicação indireta, simulação de posição, ou avisos 
para serem ouvidos, ou seja confundida por uma multidão de 
participantes e interesses divergentes, a necessidade de expec- 


tativas convergentes e o papel de sinais que têm a força de co- 
ordená-las podem ser poderosos (SCHELLING, Th. C. Idem, 


cap. 3, pp. 73-74). 


O que os testes de Schelling e tantos outros mostraram foi que nem sempre é 
possível controlar todas as variantes do jogo, a fim de limitar a fronteira na qual o 
comportamento dos indivíduos é influenciado pela sua personalidade ou capacidade 
de reconhecer objetivos claros da interação. Seja no dilema dos prisioneiros ou nas 
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suas diversas variantes, é difícil saber até que ponto os jogadores estão interpretando 


o experimento como uma simples competição ou como uma interação cotidiana a que 
estão acostumados a participarem todos os dias. Os problemas examinados em The 
Strategy of Conflict chamam atenção dos participantes para necessidade de coorde- 
narem suas ações caso queiram resolver a situação da melhor maneira possível para 
todos. 


Por vezes, a ausência de comunicação pode parecer um fator decisivo na modela- 
gem dos jogos, quando de outra perspectiva apresentam apenas um efeito sutil e rare- 
feito. A comunicação ou a falta desta, talvez influa na busca de um lugar-comum para 
resolução dos conflitos, quando os interesses dos envolvidos são em parte convergentes, 
em parte divergentes. Quando não há comunicação, o ponto focal exerce sua atração 
com força total, logo que é descoberto pelos jogadores. À medida que a comunicação 
se torna explícita, o seu “campo magnético” se dilui, permitindo um espectro maior de 
opções para os envolvidos. Entretanto, sua presença ainda se faz notar como no caso 
do ultimato, onde as divisões são feitas nas faixas entre 60 e 40 porcento e vice-versa. 


A existência de um ponto focal é uma explicação pertinente que se impõe como 
opção às hipóteses sobre sentimentos de vingança ou tentativas de se preservar a re- 
putação. Uma experiência que acabou por reforçar as concepções inatas à psicologia 
humana, em detrimento de operações racionais ou cognitivas sobre a busca de uma 
solução no Ultimato, foi feita pela equipe de neurologistas chefiada por Alan G. San- 
fey, que detectou a atuação de regiões do cérebro responsáveis por reações emocionais 
negativas - como raiva e decepção - no momento de avaliar uma oferta injusta. Sendo 
assim, a recusa não se daria por um desencontro das alternativas marcantes imagina- 
das (pontos focais), mas pelo entendimento da situação de conflito em que o agente 
se vê inserido. Tal percepção, que é ativada por outra área do cérebro voltada para os 
momentos de perigo, conduz então à conclusão provisória de que, de fato, sentimen- 
tos morais estejam atuando fortemente para que divisões consideradas injustas sejam 
rejeitadas. E que tais desacordos não ocorreriam por um mal-entendido sobre o lugar 
onde as propostas estavam sendo esperadas por agentes racionais preocupados em co- 
ordenar suas ações. Os testes dos neurocientistas estiveram focados nas respostas dos 
receptores. Resta saber que tipo de mecanismos cognitivos ou regiões cerebrais são 
mobilizadas por quem faz as ofertas de repartição. Por hipótese, se a participação do 
córtex pré-frontal dorso lateral for mais decisiva, então poder-se-ia especular se os 
pontos focais estariam a ser procurados por essa região relacionada com tarefas cogni- 
tivas direcionadas para fixação de um objetivo e deliberações a seu respeito. Mas essa 
é uma conjectura a ser investigada em outro local e momento. 


$21. A Busca do Homem Econômico 


Os experimentos de Thomas Schelling chamaram atenção para aspectos da ra- 
cionalidade que confrontam com as previsões da Teoria dos Jogos. O próprio autor 
de The Strategy of Conflict propunha modificações na orientação dada pelos teóricos 
aquela época. Sobretudo nas situações em que houvesse mútua dependência, como nas 
coordenações que precisam de um ponto focal para sinalizar o local de encontro das 
alternativas dos jogadores. A prática metodológica só foi efetivamente modificada de- 
pois que jogos evolutivos foram tratados pela teoria da cooperação de Axelrod. Só en- 


tão os diversos modelos de Dilemas - dos Prisioneiros, Sociais e Ultimato - passaram a 








enfrentar diretamente os problemas de adequação surgidos na primeira fase da teoria. 


Racionalidade, cooperação, reciprocidade, punição entre outros aspectos entraram em 
cena nas várias pesquisas que foram realizadas a partir dos anos 1980. 


O egoísmo que serviu de ponto de partida à concepção original dos agentes racio- 
nais tinha por objetivo evitar qualquer juízo de valor que por ventura viesse a distorcer 
os resultados finais da descrição dos fatores econômicos principais que levam à escolha 
de uma determinada linha de ação. Os problemas de adequação dessa perspectiva de- 
flacionada do sujeito estavam relacionados com o comportamento cooperador nas oca- 
siões em que a teoria previa o contrário. Tais aporias seguiam no sentido inverso do en- 
frentado pela filosofia que partia dos sentimentos morais e tradicionalmente precisava 
explicar o comportamento egoísta dos agentes, quando lhe fosse conveniente. Para 
a filosofia prática, explicar o comportamento do carona ou de uma pessoa sem senso 
moral sempre foi uma dificuldade extrema aos contratualistas, céticos e utilitaristas. 
Na contramão desta tendência, a teoria dos jogos se viu forçada a interpretar, o com- 
portamento aparentemente irracional das pessoas em testes laboratoriais e de campo 
que fugiam dos padrões esperados pelos pesquisadores. Nas experiências realizadas, os 
seres humanos com frequência agiam de modo não egoísta, cooperando quando deve- 
riam buscar maximizar seus próprios interesses, em primeiro lugar. Por isso, enquanto 
os filósofos se preocupavam com aqueles que sempre burlavam um acordo, procurando 
tirar vantagem toda vez que fosse possível fazê-lo em segredo, os teóricos dos jogos e 
economistas, em geral, tinham de lidar com as ações “altruístas” que fugiam à regra 
que deveria ser seguida pelo Homo oeconomicus. 


A figura imaginária desse personagem - uma assombração para os filósofos -, des- 
cobriu-se depois, na realidade não existia em nenhuma sociedade, seja ela de grande ou 
pequeno porte, onde os modelos de jogos foram examinados. Em busca do Homo oeco- 
nomicus, partiram os pesquisadores a realizarem testes com o Ultimato, Bens Públicos 
e Jogo do Ditador, através de 12 países e 15 pequenas sociedades - tribos, aldeias e pe- 
quenas cidades - espalhadas pelos cinco continentes. Essa investigação foi financiada 
pelo Grupo de Pesquisa sobre a Natureza e Origem de Normas e Preferências da Fun- 
dação MacArthur, dirigido por Robert Boyd e Herbert Gintis, respectivamente das 
Universidades da Califórnia e de Massachusetts. Os cientistas tiveram a preocupação 
de escolher comunidades que tivessem sido menos afetadas pela influência da cultura 
ocidental, a fim de saber até que ponto poderia ser considerado adequado atribuir uma 
racionalidade estratégica simples a essas pessoas”º. 


Os primeiros experimentos com estudantes estadunidenses já haviam apontado 
para um desvio do modelo canônico de comportamento previsto pela teoria. Como 
vários autores relataram, a maioria tendia a fazer uma divisão equitativa, no caso 
do Ultimato, e a iniciar cooperando nos Bens Públicos, quando deveriam proceder de 
outro modo. Mas, agora, o que se pretendia saber é se essa “falha” na racionalidade 
dos agentes supostamente egoístas era exclusiva daqueles alunos pesquisados, ou da 
própria sociedade estadunidense, e que portanto, o Homo oeconomicus deveria ser loca- 
lizado nas sociedades mais próximas da condição de vida “natural”, típica da espécie 
humana no seu início civilizatório. 


Entre as culturas que foram avaliadas, estavam as que praticavam agricultura 
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familiar, pastores nômades e pequenos agricultores. Os resultados obtidos fugiram de 


todas maneiras ao modelo padrão de comportamento da teoria econômica. A variação 
encontrada foi, então, relacionada com o grau de formação do mercado existente nas 
sociedades. Quanto maior fossem as práticas comerciais e o ganho resultante do em- 
preendimento mútuo, maiores eram os níveis de cooperação detectados”. 


Isso ía de encontro às recomendações de qual seria a atitude racional recomen- 
dada para aqueles indivíduos que procuram maximizar sua utilidade. Adam Smith 
sustentou pela primeira vez em sua Teoria dos Sentimentos Morais (1759) que uma mão 
invisível conduziria as ações de seres naturalmente egoístas de modo que a distribuição 
dos bens necessários à vida fosse tão igualitária quanto seria “caso a terra fosse dividi- 
da em porções iguais entre todos os seus moradores”?”. O mesmo argumento foi apre- 
sentado depois de uma forma mais clara, em 4 Riqueza das Nações, tal como segue-se: 


(...) Geralmente, na realidade, [cada indivíduo] não tenciona 
promover o interesse público nem sabe até que ponto o está 
promovendo. (...) Aliás, nem sempre é pior para a sociedade 
que esse objetivo não faça parte das intenções do indivíduo. 
Ao perseguir seus próprios interesses, o indivíduo muitas vezes 
promove o interesse da sociedade muito mais eficazmente do 
que quando tenciona realmente promovê-lo. Nunca ouvi dizer 
que tenham realizado grandes coisas para o país aqueles que 
simulam exercer o comércio visando o bem público (SMITH, A. 
A Riqueza das Nações, liv. IV, cap. IL, pp. 379-380). 


Mão Invisível do Leviatã 


Muitos argumentos filosóficos e econômicos foram mobilizados a favor e contra 
a postura clássica do liberalismo econômico. A concepção inicial da teoria dos jogos 
também seguiu esse modelo de agente racional, adotado pelos economistas. O ponto de 
equilíbrio descoberto por Nash parecia indicar que a solução matematicamente corre- 
ta resumiria a forma pela qual os resultados deveriam ser alcançados pelos indivíduos, 
que procuram atingir os melhores ganhos para si. Todavia, assim que o primeiro jogo 
experimental elaborado pelos matemáticos Melvin Dresher e Merrill Flood - o Dilema 
dos Prisioneiros - procurou testar essas descobertas, percebeu-se que o comportamen- 
to das pessoas racionais desviavam consideravelmente da hipótese defendida pelos eco- 
nomistas da tradição liberal. 


O Dilema dos Prisioneiros Iterado foi o primeiro obstáculo enfrentado pelos de- 
fensores da existência do Homo oeconomicus. As propriedades da repetição daquele 
Jogo emergiram para mostrar que seres humanos tendem a fugir do comportamento 
egoísta quando percebem intuitivamente que sua estratégia dominante leva a um re- 
sultado sub-ótimo. O melhor resultado conjunto só pode ser alcançado pelo empreen- 
dimento comum. Na situação do Dilema dos Prisioneiros, agir em função apenas do 
seu interesse particular acaba conduzindo os indivíduos para a deserção mútua, ao 
passo que poderiam obter o melhor resultado se fugissem da dominante. Portanto, no 
Dilema dos Prisioneiros, a mão invisível não levaria à divisão igualitária pretendida 


por Smith, mas a um resultado aquém de suas necessidades vitais. Pelo contrário, 
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considerar apenas os interesses individuais, não permite à mão invisível atingir a dis- 


tribuição igualitária. Para conseguir isso, este mecanismo deve seguir uma orientação 
obrigatória no sentido de considerar os interesses dos outros jogadores e assim escapar 
da punição. 


O jogo dos Bens Públicos que estende o dilema dos prisioneiros a um contexto 
social, por seu turno, revela que a cooperação inicial só é perdida com o aprendizado do 
comportamento egoísta, após a repetição de sucessivas rodadas. Ao voltarem-se ape- 
nas para a satisfação de seus interesses, os jogadores acabam por destruírem a oportu- 
nidade que têm para multiplicarem seus bens. Se nenhuma penalidade for instituída 
contra os desertores, a tendência será cada jogador seguir por si mesmo, esvaziando o 
empreendimento comum. A tragédia dos comuns, anunciada por Garrett Hardin, em 
1968, é outro argumento contra a validade da tese de que a maximização de interesses 
individuais pode produzir resultados ótimos em contextos sociais, que envolvam os in- 
teresses de outros participantes. Da perspectiva de Hardin, no que diz respeito ao pro- 
blema da superpopulação, a vontade de um indivíduo ter mais filhos - procriar - não 
leva a um equilíbrio que seja o melhor para cada um, mas simplesmente à destruição 


dos recursos naturais e qualquer possibilidade de ser feliz neste mundo”. 


Com o jogo do Ultimato, ocorre então a suspeita de que seres humanos inicial- 
mente partem de um comportamento cooperativo racional apoiado na busca de um 
ponto de equilíbrio que coordene suas ações ou fundado em estratégias equitativas, 
visando preservar a reputação dos agentes - seja isto algo que foi consolidado no ge- 
noma, seja por influência cultural da comunidade a que se pertença. De acordo com 
os estudos realizados nas sociedades industriais, a divisão dos recursos fica próxima 
de 44% que são oferecidos aos receptores, enquanto nos pequenos grupos culturais a 
fração proposta variava de 26 a 58 porcento. Tal variação permitiu agrupar os com- 
portamentos culturais em dois padrões nítidos. Primeiro, pela importância observada 
em cada grupo aos valores relativos à participação da cooperação. As sociedades com 
menor participação de indivíduos na troca - fora do ambiente domiciliar - ficaram 
na posição mais baixa entre as propostas cooperadoras, ao contrário daqueles que se 
envolviam em várias atividades conjuntas, principalmente as vinculadas aos aspectos 
econômicos de suas culturas. Por conseguinte, em segundo lugar, aqueles grupos com 
maior integração de mercado mostraram ter mais experiência em transações comer- 
ciais e a abstração necessária para partilhar os resultados de fácil aceitação por ambos 
concernidos””. 


Em geral, as pessoas que tomam parte desses experimentos, ao se defrontarem 
com o ineditismo do jogo, procuram atuar conforme o seu desempenho rotineiro em 
meio a seus semelhantes. Isso anulou os efeitos indesejáveis da influência da presença 
de um experimentador estranho ao grupo. Destarte, pôde-se perceber que a teoria 
econômica precisava rever suas concepções sobre o modelo econômico de agentes ego- 
ístas, interessados em primeiro lugar de satisfazer seus desejos materiais por maiores 
ganhos possíveis. O comportamento social difere radicalmente do comportamento de 
um indivíduo solitário em uma ilha deserta - um problema de maximização individual. 
A construção das preferências e das escolhas econômicas não é feita independente do 
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resto da sociedade ou da vida cotidiana em grupo. Essa vinculação da economia diária 


com as escolhas das estratégias deve ser então o ponto de partida da montagem de um 


novo modelo de agente racional realista em vez do antigo padrão individualista”?”. 


As razões mobilizadas para explicar tal divergência do comportamento humano 
em comparação ao do personagem fantasioso do Homo oeconomicus são várias e vão 
desde o hábito de participar de diversas interações repetidas; a antecipação por parte 
dos agentes das possíveis vantagens que o outro está buscando obter produziria uma 
necessidade de imaginar uma oferta justa que eliminasse a inveja e o ressentimento; 
além do fato já apontado por Maurice Allais, sobre as dificuldades dos indivíduos de 
fazerem suas expectativas subjetivas se aproximarem das matematicamente objetivas. 
Tudo indica que a insistência dos seres humanos em focarem suas deliberações em tor- 
no de partições justas não depende tão somente do ganho que cada um obterá ou do 
medo da possibilidade da rejeição, mas de uma perspectiva de longo prazo, tanto em 
relação ao passado de quem faz a oferta, como ao futuro de quem as aceita. 


A explicação evolutiva para uma tendência cooperadora já não mais se embara- 
ça com a firme convicção de que por detrás das ações dos indivíduos estão genes ego- 
ístas, lutando por maior procriação na próxima geração. O altruísmo observado, em 
contraste com o egoísmo pressuposto, não implica em contradição com a teoria evolu- 
tiva, desde que se entenda a forma recíproca dessa cooperação e as vantagens que isso 
trouxe para o genoma de um ponto de vista mais amplo. Embora individualmente, 
cada gene seja programado para se autorreproduzir, nada impede que, nos momentos 
que se mostrar oportuno, este venha a interagir e cooperar em função dos interesses do 
grupo do qual faça parte, de modo que todo um organismo possa usufruir do bem-es- 
tar dessa cooperação reciprocamente altruísta. Se tal comportamento resulta em ga- 
nhos bem-sucedidos para todos os genes envolvidos, provavelmente, as chances de suas 
estratégias se repetirem na próxima geração aumentarão. Tudo depende, é claro, que 
a reciprocidade possa recompensar cada gene envolvido na manutenção do vivente. 


Diferente das escolhas e preferências individuais que, para serem racionais de- 
pendem de respeito a características tais como a transitividade, as deliberações cole- 
tivas podem, sem contradição, apresentar inconsistências e uma decisão divergente 
daquelas que os indivíduos tomariam em outra situação. Quanto à impossibilidade das 
ações coletivas refletirem as preferências de cada um dos indivíduos incondicionalmen- 
te, o exemplo da manipulação da agenda de votação e o teorema de Arrow apresentam 
uma explicação suficiente acerca dessas posições, em primeira vista, paradoxais, mas 
cujo nó se desfaz se o comportamento de cada um for observado separadamente ou em 
grupo. 

O que para teoria econômica e evolutiva era um problema - o comportamento 
“altruísta” de agentes naturais - foi resolvido de um modo geral apelando para ações 
tomadas com base na reciprocidade. Do ponto de vista filosófico, não obstante, perma- 
necia a necessidade de explicar ou encontrar um antídoto contra as atitudes próprias 
do carona ou daquelas que sofressem da ausência de senso moral (lack of moral sense). 
Por mais que a pesquisa de campo antropológica tivesse fracassado em detectar a figu- 
ra típica do Homo oeconomicus, a tentação de poder escapar à punição, sempre que isso 
fosse possível, continuava sendo uma escolha defensável racionalmente da perspectiva 
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instrumental. Para o filósofo, seria necessário mostrar não só que o agente racional 


egoísta, de fato, não existe, mas que sua viabilidade precisa ser amplamente contesta- 
da por argumentos prévios. 


O Homo oeconomicus reúne as características do carona, que se aproveita do es- 
forço dos outros sempre que não for rechaçado, e daquele que não tem senso moral, isto 
é não possui nenhum sentimento de culpa, vergonha ou remorso, por desertar quando 
houvesse oportunidade para tanto. Na ética, o problema não está na existência ou não 
do Homo oeconomicus, mas na possibilidade de um cético sustentar a racionalidade 
de suas ações, contraposta à universalidade exigida pelo lei moral que obriga a con- 
sideração dos interesses dos outros. Em suma, as ações egoístas puras não poderiam 
encontrar argumentos racionais defensáveis, diante da suposição de que o agir moral 
também é racional do ponto de vista de todos concernidos. Ao menos foi essa a linha de 
raciocínio adotada pela tradição filosófica - Platão, Hobbes, Hume, Kant - em relação 
ao problema do cético moral. 


Se já não é mais plausível recorrer a fundamentos transcendentais para refutar as 
escolhas realizadas pelo Homo oeconomicus, as soluções empíricas precisam encontrar 
respostas além da punição, da manutenção do Estado, ou do sentimento moral evolu- 
tivo. Para entender como a moral pode evoluir de decisões egoístas, é preciso ampliar o 
conceito de racionalidade estratégica, além do próprio indivíduo, para que possa levar 
em conta os resultados disponíveis dos outros em um contexto que envolva o desempe- 
nho de, pelo menos, dois agentes. No âmbito da sociedade, os efeitos recursivos do ra- 
ciocínio estratégico - em oposição ao paramétrico - exigem que os interesses dos outros 
devam ser considerados e assim, o cálculo das deliberações precisa avaliar também as 
possíveis reações imediatas e a longo prazo. Destarte, a solução maximizadora decorre 
da necessariamente da sua extensão a todos envolvidos e não só centrada da figura do 
próprio agente. Ao proceder desta forma, as respostas estratégicas contemplariam não 
só os interesses dos outros e as externalidades decorrentes de suas ações. O que não sig- 
nifica que o sujeito tenha de abrir mão “altruisticamente” da satisfação de seus desejos 
e crenças em favor de toda sociedade, mas que a otimização dos interesses da sociedade 
incluem a maximização de seus próprios interesses. Contudo, o pensamento recursivo 
que considera a reflexão alheia tem especificações que não são tratáveis apenas do 
ponto de vista subjetivo e instrumental. Nesses casos, faz-se necessário o refinamento 
da deliberação, a fim de se poder responder adequadamente os desafios impostos pelas 
demandas dos outros participantes. O que vale dizer que a figura artificial do Homo 
oeconomicus tem de empregar recursos reflexivos, intersubjetivos, que o capacitem a 
resolver o dilema social. 


As respostas humanas aos testes de jogos realizados em campo e laboratório, pa- 
recem indicar o reconhecimento, ainda que intuitivo, dessa necessidade de transformar 
a racionalidade estratégica subjetiva, em intersubjetiva - com a necessária observação 
das respostas dos outros sujeitos. Essas respostas são influenciadas por fatores cultu- 
rais e genéticos que são moldados em decorrência da percepção do prolongamento das 
interações no futuro e a consolidação de estratégias que no passado permitiram, até 
o presente, que os organismos sobrevivessem. Portanto, a moralidade pode surgir de 
seres egoístas, do mesmo modo que com o carbono puderam se formar as moléculas 


orgânicas, bem como as propriedades específicas do indivíduo que só podem aparecer 








no seu contato com outro elemento reagente. 


$22. A Emersão da Equidade 


A noção de equidade (fairness) é fundamental para compreensão da tese central 
da Teoria da Justiça de John Rawls. É também um dos conceitos chaves do modelo 
de jogo do Ultimato. Ao longo de sua vida, Rawls trabalhou a ideia de equidade como 
uma concepção de justiça onde a sociedade foi interpretada como um sistema de co- 
operação social que deve passar de geração em geração. Trata-se de uma teoria que 
carrega de pressupostos uma interface de alto nível que obriga a tecer a trama de uma 
intricada rede de argumentos para justificar aquilo que pode ser facilmente abordado 
da maneira deflacionada que os modelos de jogos analisam a possibilidade de coope- 
ração??. 


Uma das gratas surpresas que os filósofos têm, ao examinar modelos de jogos 
como Ultimato, está na possibilidade de trabalhar conceitos tão caros para as princi- 
pais teorias filosóficas sem se comprometer com todo um conjunto de enunciados que 
frequentemente produzem uma sucessão infinita de proposições que acabam por gerar 
inconsistência na argumentação. À satisfação é maior, sobretudo, quando se percebe 
que a intuição da equidade está presente em vários tipos de agrupamentos políticos e 
não apenas entre os países de regime democrático. 


A despeito de ser uma tendência genética ou não, o fato da noção de equidade ser 
notada em sociedades além das fronteiras ocidentais colabora no sentido de reforçar 
a defesa da cooperação como um sistema adequado para o convívio humano. À teoria 
econômica tende a evitar que concepções morais distorçam as conclusões que são ex- 
traídas de conceitos e princípios formalizados de maneira mais precisa possível. Já em 
Lutas, Jogos e Debates, Anatol Rapoport se viu constrangido ao tecer análises sobre a 
racionalidade dos agentes no Dilema dos Prisioneiros valorizando a cooperação por 
levar ambos os jogadores a uma recompensa conjunta, ao invés de uma deserção pre- 
judicial a todos: “Quase que posso ouvir um coro de risadas. Deixei que a moralidade 
temperasse a razão (...)*º. 


Até aquele estágio de desenvolvimento da teoria dos jogos - no início dos anos 
1960 - os pesquisadores não se preocupavam em alinhar suas descobertas formais com 
provas contrafactuais. Nenhum teste empírico era exigido à tentativa de montar um 
conjunto sólido de axiomas que orientassem a proposição de normas para escolhas 
estratégicas apoiadas exclusivamente em uma lógica própria. Contudo como o próprio 
Rapoport havia notado, o comportamento humano dificilmente se deixaria moldar 
pelas diretrizes sugeridas pelos teóricos. Isso porque a maneira pela qual procuravam 
agir ou tomar decisões nem sempre eram lógicas ou ponderadas. 


(...) Tais normas não são lógicas, e sim arbitrárias, e podem ser 
extremamente variadas. Deste ponto em diante, portanto, não 
pode haver uma única teoria dos jogos, mas sim uma grande 
variedade de tais teorias, cada qual baseada em normas diver- 
sas. Aqui, o cientista experimental deveria naturalmente en- 
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trar em cena para explorar as normas que atuam na realidade 


nos assuntos humanos (RAPOPORT, A. Lutas, Jogos e Debates, 
part. IL, cap. XII, p. 171). 


Na prática, o que aconteceu com os jogos evolutivos e a teoria da cooperação 
subsequente foi a transformação da teoria dos jogos em poderosa ferramenta de aná- 
lise de situações empíricas, onde interesses em parte conflitantes, em parte convergen- 
tes entravam em interação. Desse modo, testes psicológicos e antropológicos puderam 
avaliar a extensão e presença dos conceitos morais nas relações humanas. Foi quando a 
reciprocidade, a confiança e a equidade puderam ser delineadas e destacadas por meio 
das simulações com modelos de jogos repetidos, começando pelo DPI. 


A pesquisa em torno do conceito de equidade ganhou impulso depois que Werner 
Giuth e seus colegas iniciaram as análises experimentais do jogo do Ultimato, em 1982. 
Na última década do século XX, essa investigação abordou o assunto sob os vários 
ângulos possíveis. Das diversas pesquisas realizadas, extraiu-se a compreensão de que 
uma média de 60 a 80 porcento das ofertas feitas estavam na faixa de 40 a 50 porcento 
do montante disponibilizado para o receptor e que algo entre três a cinco porcento 
ficava abaixo de 20 porcento, geralmente recusados. De acordo com a teoria econômi- 
ca, não haveria motivos para temer tal recusa, pois o centavo ganho seria melhor que 
nada. 


Não obstante, onde quer que tenha sido jogado, o mesmo padrão de comporta- 
mento fora observado. À explicação para isso foi que, nos encontros entre pessoas de 
uma mesma comunidade, os jogadores eram obrigados a levarem em consideração não 
apenas seus próprios interesses, mas o daquele que estava envolvido na divisão. Assim, 
as demandas do outro também teriam de ser consideradas igualmente. Karl Sigmund 
resume as explicações dos teóricos sobre esse comportamento desviante como uma 
dificuldade que as pessoas teriam para entender que o jogo será disputado apenas em 
um lance para cada jogador e não como parte do processo de barganha semelhante aos 
vividos pela humanidade desde a pré-história”. 


No passado distante, havia a dependência dos caçadores e coletores do apoio 
de vários integrantes na busca por alimento. Por causa disso, a preocupação com o 
grupo teria sido consolidada entre os seres humanos, o que explicaria a persistência de 
ofertas mais altas. Por outro lado, a recusa frequente de propostas de divisão baixas 
teria condicionado os líderes a fazerem ofertas maiores. Desse modo, a marcação da 
rejeição com respostas emocionais - indignação, vergonha, injúria e vingança - ajuda- 
ria a formação de uma reputação em quem não aceitasse esmolas ou migalhas, benefi- 
ciando-lhe em futuras negociações. Tudo isso para reforçar a ideia de que sentimentos 
morais e concepções de justiça e equidade estão entrelaçados na solução de problemas 
econômicos cotidianos. 


Padrões éticos e sistemas morais diferem entre culturas, mas 
podemos presumir que estes são baseados em capacidades uni- 
versais biologicamente enraizados; do mesmo modo como cen- 
tenas de linguagens diferentes são baseadas no mesmo instinto 
de linguagem universal. (...) [T]Jemos investigado um estágio 
onde podemos formalizar tais ideias em modelos de jogos teó- 
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ricos e testá-los empiricamente (SIGMUND,K.”The Economics 
of Fairness”, p.5). 


Independente de serem ambientais ou genéticos, os valores morais dos indivídu- 
os precisam ser mobilizados, a fim de se atingir um resultado que satisfaça os interesses 
dos participantes da interação, cada um sendo obrigado a levar em conta a reação do 
outro. Ao ter de considerar igualmente os concernidos, os aspectos fundamentais da 
moral também deverão ser observados por quem tem de tomar uma decisão eficaz. 
Caso contrário, as chances de conseguir um melhor resultado no futuro são reduzidas à 
habilidade de cada um obter por si mesmo aquilo que precisa, em um estado de nature- 
za, exposto ao conflito permanente. Fatores como a preservação da reputação, no jogo 
do Ultimato, proporcionam a emersão da equidade como a probabilidade maior de re- 
compensa, do que a tentativa meramente racional de atingir o equilíbrio perfeito, mas 
injusto. Esse fato fica ainda mais evidente quando estão disponíveis as informações 
sobre o tipo do receptor. E mesmo que a estratégia equitativa não seja a recomendada 
pela racionalidade econômica, sua aplicação acaba por fomentar as trocas comerciais. 


Isso bem concorda com as descobertas sobre a emergência da 
cooperação ou do comportamento negociador. Reputação ba- 
seada na comunicação e em compromisso desempenham papel 
essencial na história natural da vida econômica (NOWAK, M., 


PAGE, K. & SIGMUND,K.”Fairness versus Reason in the Ulti- 
matum Game”, p. 1774). 


Justiça e Equidade 
Desde Uma Teoria da Justiça (1971) até o final de sua vida John Rawls defendeu 


a noção de justiça como equidade, tendo em mente a existência, pelo menos em socie- 
dades ocidentais, de “um sistema equitativo de cooperação social que se perpetua de 
uma geração para a outra”2, Nesse sistema de cooperação, cidadãos cooperadores, 
livres e semelhantes agiriam sob o mecanismo de uma sociedade já aparelhada para 
regular a justiça em seus domínios. A partir dessas intuições, característica de regimes 
democráticos, Rawls organizou sua teoria apoiado em três outras noções essenciais: 
existência de regras públicas aceitas pelos cooperadores; ideia de reciprocidade e a 
busca por vantagens racionais”. 


Além disso, Rawls passou a fazer a distinção entre razoabilidade e racionalidade, 
como necessária para evitar o tradicional problema filosófico de considerar inconsis- 
tente ou, por vezes, contraditória a ação do egoísta racional. Efetivamente filósofos 
como Jirgen Habermas e Karl-Otto Apel tendem a considerar o carona, o lack of 
moral sense, um indivíduo que cometeria contradições performáticas ao agirem contra 
um acordo que antes houvesse considerado válido. Rawls admite que, em geral, não é 
irracional a violação de pactos, se for em benefício próprio, toda vez que se apresen- 
tasse oportunidade para tanto. Porém, a deserção poderia ser considerada irrazoável 
posto que... 


(...) pessoas razoáveis são aquelas dispostas a propor, ou a re- 
conhecer quando os outros o propõem, os princípios necessá- 


282  RAWLS, J. Justiça como Equidade, part. I, 8 2, p. 1. 
283 Veja RAWIS, ]. Op. cit. part. I, 8 2, pp. 8-9. 








rios para especificar o que pode ser considerado por todos como 


termos equitativos de cooperação. Pessoas razoáveis também 
entendem que devem honrar esses princípios mesmo à custa de 
seus próprios interesses se as circunstâncias o exigirem, desde 
que os outros também devam honrá-los (...) (RAWLS, J. Justi- 
ça como Equidade, part. 1,82, 2.2, p. 9). 


Depois que os princípios de justiça são propostos e reconhecidos como válidos 
pelos cooperadores, seria insensato não proceder de acordo com a estratégia coopera- 
dora proposta, embora não fosse irracional violá-las para obter vantagens racionais. 
Assim, toda obra de Rawls é um esforço de aliar o kantismo de seres razoáveis, que 
aceitariam o imperativo categórico de seguir os princípios de justiça, e o contratua- 
lismo que prevê ações racionais em função de imperativos hipotéticos, usando normas 
como meio para atingir um fim e não como dever ou compromisso, cuja violação acar- 
retaria culpa moral ou um erro cognitivo. 


Intuitivamente, John Rawls construiu sua teoria da justiça apoiada no mesmo 
conceito de reciprocidade detectado pelo modelo dos jogos baseados no Dilema dos 
Prisioneiros Iterado, onde a retaliação vem em seguida à deserção praticada pelo ou- 
tro. Entre os agentes que rejeitam pequenas quantias, há a percepção de que ofertas 
que poderiam ter sido feitas de forma mais equitativas devem ser recusadas com mais 
frequência. Isso implicaria que as respostas dos receptores consideram não apenas as 


suas preferências, mas também as intenções do outro em ser visto como justo”. 


Por trás da reciprocidade, haveria, então, um critério público de como cada um 
deveria se beneficiar da cooperação. Regras essas que são aceitas pelos cooperado- 
res. Agentes que sabem reconhecer as vantagens racionais que os participantes podem 
tirar da distribuição justa dos recursos obtidos pela interação na qual participam. 
Rawls admitiu a possibilidade de tal concepção ser suficiente para o desenvolvimento 
de uma teoria de justiça adequada para as sociedades bem-ordenadas que imaginara. 
Sua hipótese ganhou plausibilidade com as descobertas recentes proporcionadas pelos 
testes de jogos como o Ultimato, realizado em vários tipos de agrupamentos humanos 
espalhados por todo mundo. 


Evidente foi que, nas culturas pesquisadas, para se reproduzir um padrão de 
equidade como fora observado, deveria também de haver aquilo que Rawls chamava 


de justiça de fundo, ou seja, a estrutura básica econômica, reconhecimento da proprie- 


25 Em suma, as condições de mercado ou interação 


comerciais cujo grau de avanço era proporcional ao número de ofertas equitativas”*. 


dade e relacionamentos familiares 


Se a defesa que Rawls faz da democracia liberal, sustentada nesses pressupostos, 
pode ser oportunamente questionada, não obstante, seu ponto de partida, à primeira 
vista, parece está de acordo com as observações feitas pelos teóricos dos jogos atu- 
ais em testes de campo. A equidade emergiu nas interações entre agentes econômicos 
como uma propriedade decisiva da distribuição justa de recursos e como ponto focal 
para dirimir as disputas entre os participantes, embora esse não seja o único fator en- 
volvido. A eficácia das soluções justas só se tornou possível devido à capacidade reta- 
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liadora dos agentes e a existência desse sinal claro de que uma divisão próxima do meio 


a meio pode ser vislumbrada pelas duas partes - no caso de jogos bimatriciais (2 x 2). 
Reciprocidade também aparece como um conceito chave não só para que a cooperação 
se sustente, mas que esta seja justa. 


Uma vez mais o instrumento dos jogos permitem compreender como ocorre o 
estabelecimento das condições necessárias para o comportamento cooperador surgir 
nos seres humanos. Diferente das outras espécies, os seres humanos podem antecipar o 
futuro, observar o passado e alimentar sentimentos de vingança, vergonha, preservar 
sua reputação etc. Todas essas particularidades influenciam os resultados obtidos pe- 
las pessoas em interação umas com as outras. De fato, seres humanos não agem apenas 
como agentes racionais egoístas - previstos tanto pela teoria econômica, como pela 
biologia evolutiva. Ao longo de sua evolução, a espécie Homo sapiens acumulou em 
seu código genético e nos registros históricos informações sobre estratégias que foram 
bem-sucedidas no passado e por isso ficaram guardadas na memória, como aquelas 
como maior ou menor chance de êxito, dependendo das circunstâncias. Com base nes- 
sa experiência, intuitivamente ou conscientemente, as pessoas reagem em função das 
linhas de ação que se consolidaram como sendo as mais indicadas para maximização, 
não só dos interesses pessoais, mas considerando os interesses de outros semelhantes. 


Durante um intenso debate filosófico a definição de justiça variou sobre mui- 
tos aspectos. Porém, desde os primeiros registros legais que remontam ao Código de 
Hamurabi, uma noção mínima de justiça vem sendo reforçada. A Regra de Ouro que 
expressa a noção de reciprocidade encontrada nas mais diversas civilizações e povos 
vem se mantendo perene como principal conceito de justiça a forçar os humanos a in- 


cluírem a equidade nas suas formas de relacionamento. 








Capítulo 8: Novos Campos 
Interdisciplinares 


ogo que tiveram notícia da descoberta do conceito de ponto de equilíbrio, por John 

Nash, Merrill Flood e Melvin Dresher elaboraram o experimento que ficou mun- 
dialmente famoso — depois da história montada por Albert W. Tucker — como Dilema 
dos Prisioneiros. O objetivo era saber se pessoas que desconheciam a ideia de equilíbrio 
de Nash, ao se depararem com uma situação semelhante à matriz do jogo, reagiriam 
conforme a previsão teórica, desertando mutuamente. A experiência foi realizada nos 
laboratórios da corporação RAND, com John Williams, chefe do departamento de 
matemática da empresa, e o economista Armen Alchian, da universidade de Los An- 
geles (UCLA). O jogo foi repetido em 100 rodadas e, ao contrário de estimular o uso da 
estratégia dominante — a deserção -, acabou por gerar a cooperação entre os jogadores, 
longe do ponto de equilíbrio”. 


Efetivamente, os participantes tinham percebido que deveriam cooperar, caso 
quisessem maximizar seus ganhos, usando a dominante somente quando o outro não 
tivesse cooperado, como punição instantânea, e retomando a cooperação na rodada 
posterior — segundo o que se chamou depois de estratégia OLHO POR OLHO. John 
Nash havia demonstrado a existência de, ao menos, um ponto de equilíbrio em qual- 
quer jogo não-cooperativo finito com mais de um jogador e soma diferente de zero. 
Essa teoria foi apresentada em sua premiada tese de 1950 “Non-Cooperative Games”, 
que propunha uma solução mais abrangente do que os resultados do teorema minimax 
de Von Neumann que se restringia a jogos cooperativos e de soma zero. De fato, Nash 
logrou demonstrar a existência de ponto de equilíbrio para qualquer tipo de situação 
finita: cooperativa ou não cooperativa; soma zero ou variante; dois ou mais agentes. 
Todo seu esforço estava voltado para tornar mais úteis e práticas as ideias lançadas 
em Theory of Games and Economic Behavior (1947), por Von Neumann e Morgenstern. 
Ainda que as estratégias puras não mostrassem um ponto de equilíbrio, sempre se po- 
deria encontrá-lo por meio de mistura das linhas de ação. 


Os modelos de jogos, como o Dilema dos Prisioneiros, surgiram, portanto, como 
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uma maneira de testar as hipóteses propostas para solucionar o conflito parcial de inte- 


resses entre agentes racionais egoístas. Mais tarde o campo de aplicação de suas simu- 
lações se estendeu a todo tipo de agente — racional ou não — que tivesse de tomar uma 
decisão sobre que fazer diante de um ser semelhante que disputa os bens disponíveis, 
mas que depende do outro para alcançá-lo. Dessa forma, a construção de jogos como 
método de pesquisa permite por em prática os tradicionais experimentos mentais que 
sempre foram produto da especulação filosófica mais apurada. Só que agora, os jogos 
possibilitavam encontrar uma resposta sobre os efeitos da proposta examinada. 


No caso do Dilema dos Prisioneiros, sua matriz jogada em uma só rodada punha 
em xeque o influente mecanismo da mão invisível, anunciado por Adam Smith (1723- 
1790), em Teoria dos Sentimentos Morais (1759) e depois reapresentado em A Riqueza 
das Nações (1776). À medida que, sendo repetido várias vezes, o jogo permitia à coo- 
peração ser implementada, contra a orientação racional que era recomendada, no que 
diz respeito à mão invisível, a noção apresentada por Smith não seria capaz de fornecer 
a distribuição justa que se pensava poder realizar afinal. Ao promover suas ações no 
sentido de obter “o máximo valor possível”, cada indivíduo não conseguiria elevar ao 
máximo a renda da sociedade de modo que a distribuição desses bens, conduzida pela 
mão invisível, fosse a mais igualitária e eficiente do que se fosse planejada. Os agen- 
tes racionais, na situação do dilema, se seguirem as estratégias que maximizam seus 
ganhos individuais, acabam por gerar o pior resultado conjunto: a punição mútua”, 


Uma distribuição justa só surge quando, aos jogadores, é dada a oportunidade 
de retaliar e tolerar os erros cometidos pelos outros. O comportamento recíproco tor- 
na-se viável com a repetição frequente das rodadas. Não obstante o fato da fuga da 
estratégia dominante, no Dilema dos Prisioneiros Iterado, contradizer a previsão de 
que seres racionais a seguem e se encontram em um ponto de equilíbrio de Nash. 


O uso de experimentos por modelos de jogos para formalizar as situações de con- 
flito visa detectar os aspectos mais importantes de cada circunstância e que influen- 
ciam as deliberações, bem como o comportamento dos agentes. Desde o Dilema dos 
Prisioneiros, sua aplicação vem sendo cada vez mais incrementada. Por conta disso, os 
elementos que permitem prever as ações dos indivíduos, ou ao menos interpretar suas 
decisões, podem ser descritos de forma mais precisa. Antes dos torneios de Axelrod, 
diversos testes realizados em torno do Dilema dos Prisioneiros revelaram uma atitude 
competitiva dos participantes, tal como aquelas adotadas pelos programadores que 
tentaram bater a estratégia OPO, vitoriosa desde o início. Contudo, além da capaci- 
dade de retaliar, Axelrod havia chamado atenção para a condição de clemência (forgi- 
ving), que fazia OPO recuperar a cooperação, como característica decisiva de seu êxito 


nos dois torneios que ele promoveu??. 


A complexa ação dos elementos observados nos experimentos transformou a 
meta inicial de se construir uma teoria que buscasse em primeiro lugar a predição de 
resultados. Agora, ao invés de apontar soluções para todos os jogos, a investigação 
procura avaliar o grau de participação de cada fator deliberativo e dos princípios do 
comportamento estratégico. O conhecimento empírico adquirido pela prática dos jo- 
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gos permitiu avançar respostas para as questões problemáticas do comportamento 


estratégico, que as suposições teóricas, por si só, não conseguiam solucionar. 


(...) As previsões da teoria dos jogos, particularmente a teoria 
dos jogos não cooperativos, que suportam muitas aplicações, 
são notavelmente sensíveis aos detalhes da estrutura do jogo, e 
muito de sua sensibilidade é refletida no comportamento obser- 
vado. Tais detalhes raramente podem ser precisamente obser- 
vados ou adequadamente controlados no campo. O laboratório 
partilha alguns desses problemas, mas o controle e observação 
que técnicas experimentais modernas permitem amiúde forne- 
cer aos experimentos uma decisiva vantagem na identificação 
da relação entre o ambiente e o comportamento estratégico 


(...) (CRAWFORD, V. P “Introduction to Experimental Game 
Theory”, 1, p. 2). 


Se antes a personalidade do jogador era uma variável importante que estava lon- 
ge do alcance do experimentador, hoje, modelos como o Ultimato e o DPI procuram 
determinar os diversos aspectos da cognição humana — crenças, desejos e sentimentos 
— que interferem nas escolhas de cada um. Nesse sentido, as simplificações praticadas 
pelas simulações funcionam de modo similar aos experimentos avançados da física, 
que isolam as partículas em ambiente artificial, a fim de estudar o comportamento 
entre elas e as forças que atuam em situações específicas. Cada modelo de jogo pro- 
porciona a observação mais detalhada das características do comportamento que in- 
fluenciam as tomadas de decisão. O DPI aponta o papel fundamental da reciprocidade 
para o estabelecimento da cooperação de um modo geral. Os Bens Públicos mostram o 
papel de mecanismos como a punição na manutenção de um empreendimento comum. 
Enquanto o Ultimato revela que as emoções e o ambiente cultural também exercem 
pressão considerável na emersão de resultados equitativos. 


Sentimentos morais, como indignação, vergonha e vingança, foram incorpora- 
dos ao repertório comportamental da espécie humana à medida que suas manifes- 
tações provocavam restrições às escolhas estratégicas que a longo prazo traziam re- 
sultados prejudiciais à sobrevivência e reprodução dos indivíduos. Esses sentimentos 
proporcionariam as respostas adaptativas a diversas situações sociais e ambientais que 
envolvessem outros sujeitos e ameaçassem o bem estar do agente racional. Correspon- 


deriam então àquilo que António R. Damásio denominou de marcadores-somáticos?!. 


A base neural para o sistema interno de preferências consis- 
te, sobretudo, em disposições reguladoras inatas com o fim de 
garantir a sobrevivência do organismo. Conseguir sobreviver 
coincide com conseguir reduzir os estados desagradáveis do 
corpo e atingir estados homeostáticos, isto é, estados biológi- 
cos funcionalmente equilibrados. O sistema interno de prefe- 
rências encontra-se inerentemente predisposto a evitar a dor e 
procurar o prazer e é provável que esteja pré-sintonizado para 
alcançar esses objetivos em situações sociais (DAMÁSIO, A. R. 
O Erro de Descartes, part. 2, cap. 8, p. 211). 
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A utilização de jogos como o Ultimato permite avaliar até onde os sentimentos 


morais, adquiridos durante a evolução, se manifestam de acordo com uma lista de 
preferências internas e a compreensão dos contextos externos nos quais o agente deve 
decidir a maneira de se comportar conforme normas sociais e éticas. Martin Nowak 
e Karl Sigmund presumem que essas respostas emocionais foram montadas graças à 
convivência humana praticada por milhões de anos em pequenos grupos, nos quais 
cada um de seus membros são conhecidos dos outros. Ao passo que, a superpopulação 
e o crescimento desordenado das grandes cidades colocariam o problema do anoni- 
mato como fator perturbador das interações continuadas. O conhecimento do tipo de 
agente com o qual se interage favorece a manifestação das emoções, enquanto a recusa 
sistemática de ofertas baixas restringem sua repetição no futuro, obrigando o outro a 
aumentar os ganhos propostos e maximizar a utilidade de todos participantes”. 


Todavia, quando a impossibilidade de novos encontros entre agentes se torna 
constante, o anonimato acaba por perturbar a cooperação e proporcionar o flores- 
cimento de desertores e a insegurança das propostas e respostas. A reputação só é 
eficaz se novos encontros puderem ocorrer no futuro. Coisa que se torna difícil entre 
estranhos de uma megalópole. Pode-se saber com alguma precisão como se compor- 
tam parentes, vizinhos, amigos e colegas. Mas o controle fica difícil quanto maior for 
o número de conhecidos com os quais se interage. O efeito do anonimato é mais uma 
consequência perturbadora das grandes cidades e da superpopulação sobre o compor- 
tamento dos seus habitantes, diminuindo a confiança entre eles. Por conta dessa des- 
confiança, a exigência de garantias, mecanismos de identificação — cadastro de bons e 
maus pagadores — e aparelhos de repressão tornam-se cada vez mais necessários. 


A construção do modelo adequado de jogo permite, então, avaliar com maior 
precisão os componentes relevantes de interação. A partir disso, as decisões a serem 
adotadas no intuito de fomentar ou restringir a cooperação podem ser sugeridas com 
maior probabilidade de correção. Desse modo, o emprego de simulações e jogos entre 
agentes humanos ajuda a compreender melhor os aspectos sutis que subjazem à in- 
teração. Com isso, as hipóteses tecidas por teóricos que estudam o comportamento 
humano podem ser testadas no sentido de fazer valer ou derrubar as conclusões tiradas 
sobre a cooperação que acontece no mundo concreto. 


A pesquisa realizada por esse método deve atender alguns requisitos básicos 
acerca da maneira como a experiência será modelada, da análise dos resultados e sua 
divulgação. Os modelos de jogos funcionam como os experimentos mentais, bastante 
difundidos em textos filosóficos, mas que podem ser reproduzido por meio eletrônico 
ou questionários tradicionais, em papel. De um modo geral, parte-se de hipóteses sim- 
ples que uma vez implementadas geram consequências complexas ou paradoxais. Os 
efeitos decorrentes da complexidade de interação entre agentes simples fazem emer- 
gir propriedades que não eram observadas antes no comportamento individual. Tais 
propriedades emergentes são temas comuns às pesquisas feitas na física contemporânea 
sobre os sistemas complexos abordados sob a perspectiva da Teoria do Caos. 


Nesse sentido, hipóteses fortes sobre a racionalidade das escolhas podem ser en- 
fraquecidas, no intuito de abranger toda forma de atuação de indivíduos cujo proces- 
so de deliberação leva a inferência de algum princípio dedutivo. Seres muito simples 
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poderiam ser incluídos nessa pesquisa, concebendo suas escolhas como geradas por 


meio de um processamento de informações obtidas no meio ambiente que provocam 
uma resposta do agente. Essas respostas dar-se-iam através de um conjunto de regras 
incorporadas que produziriam uma maneira de extrair ações em função da entrada de 
informações. 


Quanto mais simples forem os testes baseados no modelo de agente, maiores são 
as possibilidades de se perceber o processo fundamental ascendente que se inicia com 
os elementos básicos da interação e se eleva às conclusões gerais sobre o comporta- 
mento social. A validade interna do procedimento que conduz esse tipo de pesquisa 
a resultados consistentes depende do grau de precisão entre elementos que compõem 
o experimento e a situação real analisada. Resultados contraintuitivos causam forte 
discussão sobre a possibilidade de algum erro ter sido cometido na formulação ou exe- 
cução dos modelos propostos. Nesses casos, deve-se proceder ao reexame de todo mé- 
todo empregado, utilizando propostas alternativas, variantes e contraexemplos, a fim 
de se detectar possíveis falhas na aplicação dos testes que devem também ser flexíveis 
o suficiente para permitir novas versões aprimoradas e extensões a diversas circuns- 
tâncias??, 


Os modelos mais avançados de estudo do comportamento de agentes incluem 
abordagens de redes neurais, algoritmos que podem evoluir e técnicas de aprendizagem 
que se aplicam à maneira como os indivíduos se adaptam nas interações cotidianas. 
O sistema de agentes é modelado com base em informações sobre como os agentes to- 
mam suas decisões de modo autônomo. Assim, procura-se saber como são organizados 
os mercados, o fluxo da população e a difusão das estratégias simuladas de um ponto 
de vista “atômico” (partículas mínimas e indivisíveis) da sociedade como alternativa à 
visão “macroscópica”, que é descendente. À rigor, a simplicidade dos modelos não deve 
diminuir a importância e a profundidade dos conceitos trabalhados. 


Nas ciências sociais, as simulações dos contextos da sociedade têm estimulado a 
mudança de metas tradicionais que antes buscavam uma ferramenta que produzisse 
resultados previsíveis, mas que agora se restringem aos limites da tarefa de compreen- 
são do modo como os agentes atuam. Nas palavras de Eric Bonabeau — então, pesqui- 
sador da Icosystem Corporation -, “prever o sucesso pode ser simples, mas coisa difícil 
de fazê-lo; entender como o sucesso acontece é um uso melhor do modelo”?!. Tais mo- 
delos são úteis para mostrar o modo complexo de como o agente aprende e se adapta 
a uma situação. Além disso, podem ser aplicados para avaliar a mobilidade territorial 
e a resistência a invasões, sobretudo, quando o comportamento dos indivíduos de uma 
população é heterogêneo e varia de região para região — nas relações de convívio fami- 
liar, vizinhança, instituições públicas, trabalho etc. 


Em geral, os temas de maior interesse para essa área do conhecimento são as 
questões sociais, políticas e econômicas, que devem aplicar modelos específicos para 
cada proposta de investigação e não forçar o uso de um modelo de solução universal 
para todos os problemas da humanidade. Como já se tentou destacar os DPI, os Bens 
Públicos e o Ultimato, por exemplo, servem para tratar questões de reciprocidade 
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direta, indireta e de equidade, respectivamente, com maior precisão. Isso não implica 


em soluções ad hoc, pois a formalização empregada segue os mesmos procedimentos 
gerais da teoria dos jogos, variando apenas os elementos que têm de ser mudados de 
modo realista. Para as ciências sociais, o modelo de jogos talvez seja a única maneira 
viável, salvo melhor juízo, de abordar a inconsistência do comportamento humano e 
seu complexo processo cognitivo de escolha. 


Os jogos experimentados vêm expandindo-se além dos domínios econômicos e se 
tornando um ambiente próprio para troca de informações interdisciplinares. Mesmo 
quando são tratados por economistas, suas conclusões dizem respeito a outras ma- 
térias pertinentes, como no caso da avaliação da equidade nos modelos de jogos que 
interessam desde áreas administrativas até as neurociências em suas mais recentes 
descobertas. 


$23. As Diversas Disciplinas que Empregam os Modelos de Jogos 


Logo no primeiro capítulo de Theory of Games and Economics Behavior, John 
Von Neumann e Oskar Morgenstern colocaram como única possibilidade de solução 
para os problemas de diversas situações típicas da economia - troca de bens, monopó- 
lio, oligopólio e livre competição - a abordagem destes através dos métodos matemá- 
ticos contemporâneos. À teoria dos jogos moderna já surgia como a responsabilidade 
de aplicar as técnicas de uma disciplina (a matemática) sobre outra (a economia). As 
análises dos jogos estratégicos vinham desenvolvendo-se, desde 1928, com a pesquisa 
de matemáticos acerca da melhor maneira de vencer em jogos de xadrez, pôquer e ou- 
tros divertimentos de salão. A ideia era de que o comportamento econômico poderia 
ser descrito ou interpretado do mesmo modo que esses jogos estratégicos”. 


O que aqueles dois autores imaginavam era que a matemática poderia ser útil à 
economia, da mesma forma como fora para as diversas teorias da física - calor, nuclear, 
quantas etc. Apesar do ceticismo das ciências sociais, que consideravam a psicologia e 
o comportamento humano fenômenos de difícil trato formal, acreditava-se que uma 
formulação clara desses problemas seria o primeiro passo para o emprego da mate- 
mática, também em economia. Por outro lado, o uso do instrumental matemático 
adequado à economia evitaria o desconforto de iniciativas anteriores nesta direção em 
relação a uma física social - como fora proposta pelos positivistas, marxistas e malthu- 
sianos -, procurando assim orientar-se pela aplicação de novas técnicas relevantes, tal 
como o cálculo diferencial para o estudo de trajetória de objetos no passado. 


O ceticismo inicial não permitiu que os economistas se entusiasmassem pela te- 
oria dos jogos. Em Uma Mente Brilhante, Silvia Nasar lembra que as contribuições da 
obra de Von Neumann e Morgenstern estavam limitadas a uma reapresentação mais 
extensa do teorema minimazs e uma nova roupagem de problemas econômicos tradicio- 
nais. Isso explica, porque durante muito tempo a teoria dos jogos continuou sendo um 
tema mais difundido entre matemáticos do que entre economistas. Por tratar priori- 
tariamente de jogos de soma zero, o alcance da teoria ficou reduzido aos interesses de 
militares que interpretavam a guerra como um jogo que para um vencer, outro tem 
necessariamente que perder?. 
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A partir da descoberta do ponto de equilíbrio, por John Nash, para jogos não- 


cooperativos com múltiplos jogadores, o interesse de cientistas sociais pôde ser des- 
pertado. Fora da matemática e da economia, ou administração, os primeiros textos 
publicados sobre o tema foram Theory of Games as a Tool for the Moral Philosopher, de 
Richard B. Braithwaite, lançado em 1955. Cinco anos depois, o psicólogo Anatol Ra- 
poport apresentou Lutas, Jogos e Debates. Enquanto Richard Lewontin foi o primeiro 
biólogo a escrever a respeito em “Evolution and Theory of Games” (1961). 


Nessa fase de aproximação, as principais objeções levantadas partiram do eco- 
nomista francês Maurice Allais. Suas críticas estavam voltadas para as dificuldades 
de seres humanos se comportarem racionalmente em condições de risco ou incerteza 
conforme os resultados previstos pela teoria. A suposta irracionalidade dos humanos 
observados diante do risco afrontava diretamente os axiomas assumidos pela teoria 
econômica estadunidense da metade do século XX. Uma resposta satisfatória a essas 
questões só foi bem-sucedida, depois dos psicólogos israelenses Daniel Kahnemann e 
Amos Tversky lançarem a Teoria das Perspectivas, em 1979. O sucesso dessa teoria em 
suas implicações econômicas valeu o Nobel de economia de 2002 a Kahnemann e cer- 
tamente seria estendido a Tversky, caso este estivesse vivo à época - Tversky falecera 
em 1996, vítima de câncer. 


Jogos Dinâmicos 

Até que a Teoria das Perspectivas viesse elucidar o comportamento de incon- 
sistência aparente dos agentes humanos, em escolhas envolvendo risco e incerteza, 
a teoria dos jogos sofreu várias críticas de economistas acerca da concepção forte de 
racionalidade dos jogadores que não correspondiam ao real desempenho dos agentes 
racionais. Além disso, muitos conceitos chaves, como ponto de equilíbrio e axiomas 
da transitividade das preferências, foram atacados através de experimentos simples, 
como o Dilema dos Prisioneiros, que obrigavam uma revisão das deliberações que fu- 
giam do padrão teórico previsto. 


Enquanto a intransitividade das preferências esbarraria no problema insolúvel 
do teorema de Arrow, para o bem-estar social, o dilema dos prisioneiros acabou por 
transformar a teoria dos jogos estáticos imaginada por Von Neumann e Morgenstern 
em uma teoria de jogos dinâmicos que rapidamente foi desenvolvida e incorporada aos 
métodos de pesquisa da biologia evolutiva contemporânea. 


Em Theory of Games and Economic Behavior, seus autores foram enfáticos em 
procurar delimitar sua formulação à busca de compreensão das evidências de como as 
pessoas se comportam em uma dada situação. Primeiro era preciso entender como as 
decisões são tomadas em um instante determinado para depois investigar as repeti- 
ções sucessivas das mesmas circunstâncias iniciais. Sob o argumento de que, uma vez 
encontrado o equilíbrio, não haveria razões para mudanças, eles rejeitavam a necessi- 
dade de se desenvolver uma abordagem dos jogos dinâmicos, naquele estágio teórico 
preliminar?”. 


Entretanto, depois que, sobretudo, Axelrod colocou o Dilema dos Prisioneiros 
Iterado no centro de sua Teoria da Cooperação, o estudo dos jogos dinâmicos acabou 
por preencher a lacuna deixada pela teoria original e apresentou um amplo espectro 
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de possibilidades para sustentação do equilíbrio em situações mais favoráveis do que a 
do jogo base, de um só lance. Assim, resultados na fronteira do ótimo de Pareto pode- 


riam ser alcançados permitindo aos jogadores observarem as reações do outro a suas 
decisões e, nesse, sentido reorientar duas estratégias. Na biologia evolutiva, foram os 
Jogos dinâmicos uma ferramenta empregada na explicação de diversos comportamen- 
tos paradoxais, observados não só em humanos, mas em todo tipo de ser vivo. Surgiu, 
então, uma nova classe de jogos evolutivos que transformou por completo a interpre- 
tação da teoria dos jogos tradicional, não se detendo mais em agentes racionais, mas 
abordando a conduta de qualquer tipo de indivíduo que fosse capaz de atuar conforme 
as condições do meio e a presença de uma outra parte reagente. 


Por conta dessa nova abordagem, a teoria dos jogos e sua modelagem formal 
das interações atraíram a atenção de pesquisadores de muitas outras disciplinas afins, 
interessadas no estudo do comportamento de sistemas dinâmicos. Para a Teoria do 
Caos e para a Inteligência Artificial, a teoria dos jogos apresentou a possibilidade de se 
programar autônomos celulares que simulassem a cognição e o movimento oscilatório 
pertinente a condições de vida no limite entre o caos e a ordem. Desse modo, a teoria 
dos jogos conquistou a física contemporânea e a ciência cognitiva mais avançada. 


Se na teoria econômica a teoria dos jogos ficou restrita à microeconomia, nas ou- 
tras áreas do conhecimento veio galgando espaços cada vez mais amplos. Na biologia, 
está no centro dos experimentos a respeito da evolução do comportamento e consoli- 
dação das emoções na psicologia humana. De fato, os jogos evolutivos vêm ganhando 
cada vez mais atenção de pesquisadores fora da biologia. O afastamento inicial dos 
economistas não impediu que experimentos com modelos dinâmicos fossem usados 
para atacar os pressupostos teóricos do liberalismo econômico que não se sustentam 
na prática. Nessa linha de investigação, testes que avaliam a capacidade de cooperação 
dos jogadores estão sendo empregados como métodos que ajudam a revelar mecanis- 
mos que estão por detrás da complexa atividade humana. 


Na economia, os jogos experimentais estão em expansão, graças à gama de pos- 
sibilidades de aplicação, já demonstrada pelos evolucionistas. Karl Sigmund, econo- 
mista austríaco, recomenda sua utilização no estudo das interações cotidianas de co- 
mércio entre pessoas de diversos países por meios eletrônicos, através da rede mundial 
de computadores. Essas e outras relações interpessoais funcionariam a despeito da 
ausência de contratos explícitos e instituições que deveriam regular essas trocas em 
escala global”. 


Neuroeconomia 


Por causa do sucesso do individualismo metodológico na biologia e ciências so- 
ciais, os jogos dinâmicos abrangem atualmente áreas que antes não eram atraídas. A 
neuroeconomia é um novo campo interdisciplinar que cresce com a reunião dos mode- 
los de jogos à investigação neurológica, por meio de tomografia computadorizada, des- 
pertando o interesse de economistas e neurocientistas que querem descobrir as causas 
fisiológicas do comportamento dos agentes. Antes, a tática de evitar abordagens que 
levassem em conta juízos de valor era defendida por economistas que procuravam co- 
locar suas teorias mais próximas dos métodos científicos. Assim, desde o século XIX, 
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os economistas tratavam de desenvolver técnicas de formalização matemática que não 


fizessem menção a sentimentos e estados mentais dos indivíduos. Não obstante, se no 
passado não era possível trabalhar de modo experimental a cognição humana - a ma- 
neira pela qual as reações nervosas ocorriam no cérebro e provocavam por conseguinte 
um comportamento respectivo -, com o avanço da tecnologia não invasiva de observa- 
ção das atividades cerebrais relacionadas a um estímulo qualquer permitiu identificar 
as áreas responsáveis pelo comportamento econômico, já no final do século XX. A 
conduta humana surge da atividade conjunta do sistema de reações automáticas e 
controladas, dependendo da interpretação da ocasião em que se provoca uma atitude. 


A neuroeconomia informa os pesquisadores de ambas modalidades - neurociên- 
cias e economia - sobre o papel do sistema nervoso no processo de decisão em nego- 
ciações rotineiras. Por conta disso, além das variáveis tradicionais a serem observadas 
é preciso saber o estado mental do agente em relação ao tipo de ação que irá adotar. 
Em geral, os economistas imaginam que as escolhas dos agentes são resultados finais 
de um processo de tomada de decisão que, quando chegam a um equilíbrio não podem 
mais ser mudados. Entretanto, os recentes estudos neurológicos têm mostrado uma 
interferência do sistema autônomo de respostas que não é necessariamente percebida 
conscientemente e, por tanto, não depende do controle efetivo do sujeito. Por outro 
lado, há circunstâncias em que as emoções exercem também um papel decisivo, de 
acordo com o calor do momento. 


Os métodos das neurociências procuram mapear as áreas do cérebro que traba- 
lham no processamento das escolhas econômicas, identificando, por vezes, os neurô- 
nios atuantes, seja por meio de estímulos elétricos ou químicos. Saber como o cérebro 
funciona nessas ocasiões ajuda a compreender melhor que hipóteses teóricas são sus- 
tentadas pelas evidências empíricas. Alguns dos conceitos criados pelos economistas, 
na prática, não acontecem nos testes realizados, tais como avaliação do risco, o descon- 
to paramétrico do futuro e considerações altruístas, sobretudo quando as decisões são 
derivadas de um processo automático de seleção. Isto é, não haveria nenhum módulo 
isolado no cérebro que fosse especializado nesse tipo de avaliação. O que vale dizer que 
para o risco ser corretamente percebido, precisa estar envolvido em um contexto de 


incerteza ou insegurança para ser adequadamente estruturado??. 


Uma vez contextualizado o problema, o processo afetivo pode então motivar o 
agente a seguir ou não uma tendência delimitada pelas opções disponíveis. Da perspec- 
tiva neurológica, as preferências, os interesses, as crenças e os desejos do agente só exis- 
tem em função da sua sobrevivência e reprodução. Estes fatores são fins ou meios que 
são marcados como relevantes em razão da manutenção de um equilíbrio homeostáti- 
co dos organismos que assegure sua existência e perpetuação, nas condições impostas 
pelo meio ambiente. A homeostase é, portanto, o princípio que conduz todo processo 
deliberativo exercido pelo sistema nervoso. Em outras palavras, tudo é decidido no 


sentido de procurar preservar a integridade física do organismo*"º, 


Pesquisas do economista Ernst Fehr, Michael Kosfeld e seus colegas da Univer- 
sidade de Ziirich têm ajudado a revelar que a confiança nas relações sociais pode ser 
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incrementada, quando é inalado pelos agentes um neutransmissor conhecido como 
oxitocina. Esse hormônio é produzido naturalmente pelo hipotálamo, região do cére- 
bro que controla a regulação biológica e também as emoções. Trata-se de uma subs- 
tância química chamada peptido formada por nove aminoácidos. É utilizada por via 
intravenosa para indução do parto e de modo intranasal para estimular a lactação. 
Também ajuda a reduzir e controlar a hemorragia pós-parto, sendo contraindicada 
para pessoas hipertensas ou quando há complicações na gestação. Não deve ser admi- 
nistrada de forma oral por ser facilmente metabolizada pelo aparelho digestivo. Atua 
no sistema nervoso em regiões associadas com o comportamento emocional e social 
(como a amígdala). Nos mamíferos, a oxitocina diminui a resistência natural dos ani- 
mais à aproximação de estranhos*!. 


A equipe do Instituto para Pesquisa Empírica em Economia de Zirich borri- 
fou um líquido contendo a oxitocina e outro com placebo, respectivamente, em dois 
grupos distintos de jogadores que participaram anonimamente de uma variante do 
Ultimato conhecida como Jogo da Confiança. Neste tipo de jogo, duas pessoas atuam 
sem saber quem é o investidor ou o depositário. O investidor deverá escolher uma parte 
ou o total de uma quantia disponível para ser enviada a um depositário. Ao fazer isso, 
o valor que for investido será multiplicado pela banca (o experimentador) e imediata- 
mente remetido ao depositário, que de posse dessa transferência deve então decidir se 
devolve alguma parte, todo o dinheiro ou nada. 


O Jogo da Confiança testa a confiabilidade do investidor no retorno de seu capi- 
tal por parte do depositário. Entretanto, o investidor enfrenta o dilema de fazer um 
alto investimento e arriscar a ter sua confiança explorada pelo depositário ou investir 
pouco e passar a ser alvo da indignação do segundo jogador, que pode considerar injus- 
ta a fração que recebe, em relação ao que o primeiro guardou para si. Nos experimen- 
tos realizados por Kosfeld, os investidores recebiam $12 e tinham as opções de aplicar 
nada, $4, $8 ou tudo. Os valores eram depois triplicados e enviados ao depositário. 
Este somava as transferências com os $12 que também recebera do experimentador 
e decidia quanto deveria devolver ao investidor, a saber: zero, 812, $24, $36 ou $48ºº, 


Os participantes da experiência foram divididos em dois grupos. Os investido- 
res que inalaram a oxitocina aumentaram suas transferências em média 17 porcento, 
em comparação ao grupo de controle que inalou placebo. Esse comportamento indi- 
cou que a oxitocina interfere nas interações sociais, estimulando a confiança no outro, 
mesmo que desconhecido. Razões para esta conclusão foram reforçadas, pois quando 
o investimento sofria a incerteza do risco - com uma taxa de probabilidade de não ser 
devolvido - ou quando era informado que o depositário era uma máquina, a oxitocina 


não produzia nenhum efeito perceptível”. 


Além do mais, a oxitocina só agia sobre as decisões do investidor e não do depo- 
sitário. Isto porque, os primeiros exercem papéis psicológicos diferentes dos segundo. 
Cabe ao investidor ter a iniciativa de abordar o depositário, enquanto este tem apenas 
de avaliar se responde a ele reciprocamente ou não. O que significa que a oxitocina não 


atua sobre a reciprocidade, mas afeta o contato interpessoal, estimulando a interação 
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social, que os biólogos chamam de “comportamento de abordagem”. 


Os experimentos com jogos em que participam pesquisadores de vários campos 
de investigação avançam rapidamente. Os resultados obtidos até agora, sobretudo na 
nova neuroeconomia, apontam para uma promissora área de atuação para jovens pes- 
quisadores interessados em abrir a “caixa-preta” que processa as deliberações econô- 
micas e sociais. O mistério da consciência e do comportamento humano nunca esteve 
tão perto de ser elucidado. 


824. Uma Nova Visão da Ética 


Da filosofia, pode-se dizer que foi a origem de todas as ciências. No início, passa- 
do o espanto original da percepção da regularidade dos fenômenos, os primeiros filóso- 
fos grosseiramente tentaram estabelecer princípios que pudessem explicar a origem de 
todas as coisas. Pouco a pouco, um maior refinamento do debate filosófico exigiu a for- 
mulação de argumentos e conceitos que explicassem as dificuldades que vinham sendo 
apresentadas. Da simples observação dos fenômenos e dedução de sua ocorrência, vol- 
tou-se para formulação de hipóteses que depois deveriam ou não ser confirmadas pela 
experiência. Por vezes, a lógica perfeita do conjunto de proposições era um substituto 
conveniente para qualquer prova material. Assim, surgiu o pensamento metafísico e 
a própria ética que não se detinham pela ausência de qualquer contraexemplo que 
justificasse suas pretensões. 


A observação inicial cedeu espaço a uma especulação dedutiva por meio da qual 
se pensava possível interpretar o mundo e o lugar do ser humano neste. Regras de infe- 
rência, solidamente construídas, garantiam a verdade das proposições. Não obstante, 
à medida que novos fenômenos iam sendo detectados, as propostas anteriores eram 
assaltadas por diversas indagações que, caso não fossem respondidas de modo satisfa- 
tório, minavam as bases antes tidas como inabaláveis. A metafísica e a metaética que 
se mantiveram apegadas a teologias perduraram dogmaticamente por longos séculos. 
Mas a crescente demanda por novas explicações gerou a especialização de vários ramos 
teóricos que fragmentavam o conhecimento em diversas disciplinas distintas e, por 
vezes, divergentes. 


O desdobramento do Iluminismo levou à formação de muitas novas maneiras de 
investigar a natureza, o que acabou por criar, no século XIX, as principais ciências 
conhecidas hoje. Nesse período, a ética, ou filosofia prática, passou por várias tendên- 
cias que oscilavam entre o materialismo e o idealismo. Do rigorismo kantiano por fazer 
valer suas normas, qualquer que fosse o contexto, até o utilitarismo de ato, voltado 
para as consequências das ações morais, a ética também apresentou fortes discussões 
em torno do modo de sustentar os argumentos em favor de determinados princípios, 
bem como a aplicação dos seus preceitos ao cotidiano. Desde Sócrates (470-399 a.C.), 
os principais pesquisadores dessa área vêm julgando a necessidade e conveniência de 
se pôr em prática as leis morais propostas por suas teorias. 


A moral teve sua origem histórico-filosófica nas questões levantadas por Sócra- 
tes, na Grécia do século V a.C., e que foram exaustivamente desenvolvidas nos diálogos 
platônicos e nos Ditos e Feitos Memoráveis de Sócrates, de Xenofonte (c. 4238-354 a.C.). 
Na obra de Platão, Sócrates considerava que as demandas éticas só poderiam ser ple- 
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namente resolvidas com o conhecimento de si mesmo por parte dos indivíduos. Uma 
vez alcançado tal conhecimento, a percepção das virtudes permitiria uma atuação 
política correta, segundo os ideais perpétuos de um mundo ulterior”. Não obstante, 
um Sócrates muito mais preocupado com a utilidade das decisões e do conhecimento 
filosófico aparece em diversas passagens dos Memoráveis”"º. 


Por sua vez, o filósofo alemão do século XX, Martin Heidegger (1889-1976)*"”, 
via no fragmento 119 — ethos anthropo daimon*-, atribuído a Heráclito de Éfeso (c. 
2940-480 a.€.), o sentido originário da ética, como lugar onde o homem habita, sua mo- 
rada, diferente da concepção de um bem (agathon) socrático e platônico a ser buscado 
num mundo ideal. Heidegger amparava-se, para tanto, na passagem Das Partes dos 
Animais A, 5, 645 a, 17, de Aristóteles (3984-322 a.€.), em que se conta uma anedota 
na qual Heráclito teria dito a estrangeiros que temiam se aproximar de sua pobre mo- 


radia : einai gar kai entautha teous (pois aqui também moram os deuses)”. 


Se, portanto, de acordo com a significação fundamental da pa- 
lavra ethos, o nome Ética diz que medita a habitação do ho- 
mem, então aquele pensar que pensa a verdade do ser como o 
elemento primordial do homem enquanto alguém que ec-siste 
[sic] já é emsi a Ética originária. Mas este pensar não é ape- 
nas então Ética, porque é Ontologia. Pois a Ontologia pensa 


sempre apenas o ente (on) em seu ser (...) (HEIDEGGER, M. 
“Sobre o “Humanismo”?, p. 171). 


Heidegger percebia nessa busca ética por um conhecimento próprio como uma 
investigação ontológica pela essência do ser. Com isso, um sentido originário da ética 
a reduziria a um domínio da metafísica em que se teria de comprometer com verda- 
des absolutas tão difíceis de sustentar, quanto as pretensões de uma ética tradicional 
apoiada numa revelação divina. Contudo, se ao sujeito falível contemporâneo está ve- 
dado o acesso ao verdadeiro conhecimento das essências e a crença em Deus não passa 
de uma crença a mais a ser considerada, então uma ética centrada no sujeito precisa 
descartar pretensões tão elevadas e tentar explicar como, da perspectiva subjetiva, é 
possível sustentar concepções éticas, válidas objetivamente, sem passar por um con- 
senso intersubjetivo. 


Aristóteles argumentou por uma interpretação de ethos, não como morada, mas 
como um hábito ou prática que o sujeito deveria optar a fim de realizar os “atos no- 
bres”, uma vez que o conhecimento da virtude não seria suficiente para que o homem 
comum exercesse a função de um ser racional, nobre e virtuoso?!". Entretanto, Aristó- 
teles esbarrou no mesmo problema que Kant enfrentaria dois mil anos depois, de como 
fazer com que seres racionais e sensíveis fossem capazes de ou contemplar a verdade, 
eudemonia, ou de agir segundo o dever racional. Ambos pensavam que as inclinações 
sensíveis limitavam a motivação racional pela ética e quanto a isso não tinham solução 
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que resolvesse, no âmbito da subjetividade”. 


Para que um ser, ao mesmo tempo racional e afetado pelos sen- 
tidos, queira aquilo que só a razão lhe prescreve como dever, 
é preciso sem dúvida uma faculdade da razão que inspire um 
sentimento de prazer ou de satisfação no cumprimento do de- 
ver, e, por conseguinte, que haja uma causalidade da razão que 
determine a sensibilidade conforme aos seus princípios. Mas é 
totalmente impossível compreender, isto é, tornar concebível 
a priori, como é que um simples pensamento, que não contém 
em si nada de sensível, pode produzir uma sensação de prazer 
ou de dor; pois isto é uma espécie particular de causalidade, da 
qual, como de toda causalidade, absolutamente nada podemos 
determinar a priori, mas a respeito da qual temos de consultar 
a experiência. (...) (KANT, 1. Fundamentação da Metafísica dos 
Costumes, B 122-123). 


Por dois lados, a moral centrada no sujeito encontra problemas que até o pre- 
sente não foram resolvidos. Primeiro, as limitações naturais evidentes que impedem 
os indivíduos de determinar por si só a sua própria função ou bem e alcançá-lo. Em 
segundo lugar, ainda que pudesse descobrir qual fosse tal bem, enfrentaria também 
os obstáculos que surgem durante sua busca e motivação, frente à disputa com seres 
semelhantes, pelos recursos escassos. Além disso, uma postura particularista da ética 
põe em choque os diversos fins subjetivos conflitantes, possíveis de serem eleitos pelos 
agentes, e que só uma perspectiva mais ampla e abrangente teria condições de solu- 
cionar. À insuficiência dos seres vivos, a falibilidade da razão e o conflito de opiniões 
impedem que uma ética subjetivista logre qualquer êxito prático. Desta se exige que 
indique qual a essência do ser humano, como ele a determina ou é determinado, se 
pode a conceber ou não, e ainda como pode pôr em prática uma ação consequente, 
efetivamente moral, sem ter de levar em conta concepções contrárias de seres seme- 
lhantes. 


Dada a dificuldade da moral centrada no agente responder essas demandas, resta 
reconhecer as limitações da razão, da sensibilidade e da capacidade física do sujeito 
para sustentar exclusivamente qualquer moral. As soluções para os problemas de uma 
moral particular se resolvem em grande parte quando são considerados também os 
interesses de outros agentes, num cenário de escassez de recursos, onde cumpre a moral 
orientar as ações humanas consideradas válidas por todos envolvidos. O isolamento 
dos indivíduos logo vislumbra a impossibilidade de alguém realizar sozinho seus fins. 
No momento em que se reconhece isso, cada um deve procurar adequar suas linhas 
de ação às circunstâncias, nem sempre favoráveis, que tem de enfrentar, caso queira 
satisfazer ao máximo seus interesses, quaisquer que sejam. 


Em meio a um cenário passível de concorrência por outros atores semelhantes, o 
agente pode adotar uma perspectiva na qual se coloque como a única fonte de ações, 
capaz de reagir ativamente às pressões ambientais, adotando o ponto de vista de pa- 
râmetro exclusivo de atuação. Nesse caso, a visão paramétrica gerará distorções toda 


all Veja ARISTÓTELES. Op. Cit. liv. X, cap. 7, 1ITIb, 25-30 e KANT, 1. Fundamentação da Metafísica dos Cos- 
tumes, III seç., B 122-129. 








vez que agentes semelhantes tenham de competir pelos recursos escassos, necessários 


para realização de seus objetivos. Os piores resultados são esperados quando todos 
envolvidos seguem uma postura paramétrica. Os exemplos eloquentes do Dilema dos 
Prisioneiros e outros modelos de interação extraídos da Teoria dos Jogos ajudam a 
compreender melhor a inviabilidade desse tipo de subjetividade. 


Para evitar os embaraços de uma postura paramétrica, convém adotar, então, 
uma percepção estratégica, onde os agentes reconhecem, recursivamente, em seus se- 
melhantes as capacidades relevantes que permitem com que eles reajam de maneira 
tal e qual os próprios agentes também reagiriam, diante da ação do outro. Assim, o 
reconhecimento da necessidade de considerar os interesses dos outros obriga à des- 
centralização da moral, que passa a ser regida então por padrões intersubjetivos pelo 
encontro de estratégias conjuntas que satisfaçam os interesses de todos envolvidos, 
caso se queira resolver os conflitos que os seres vivos enfrentam na busca de sua “au- 
torrealização”. As condições naturais que os agentes vivem explicam a necessidade 
de se observar o processo pelo qual tais seres passaram até poderem produzir uma 
coordenação das próprias ações, tendo por consequência uma melhor distribuição dos 
meios indispensáveis para que cada um atinja suas metas de modo mais fácil e rápido. 


Todo teor da moral reside na preocupação com o outro e mesmo os pontos de 
vistas essencialistas ou perfeccionista de uma ética das virtudes ou ideal de bem defen- 
dem, tradicionalmente, a realização humana em sua participação da sociedade. A vida 
política de um agente moral constrói-se com sabedoria prática e atos que condizem 
com a condição humana. Entretanto, o risco de tomar-se uma posição arbitrária e vo- 
luntarista de quem assume tal postura desencadeou alguns acontecimentos históricos 
temerários e desastrados. Platão pagou com a perda da própria liberdade a tentativa 
de adestrar o tirano de Siracusa, Dionísio, enquanto Karl Marx (1818-1883) inspirou 
os comunistas a implantarem pela força uma utopia que arrastou milhões de vidas no 


século XXº2, 


Esses episódios puseram em xeque as teorias éticas sobre o bem agir e distribui- 
ção igualitária de recursos. Tanto a moral subjetiva, quanto a universalista, caíram em 
descrédito por serem irrealistas. Faltou aos tradicionais teóricos da ética um disposi- 
tivo que pudesse aferir suas máximas e apontar as possíveis falhas. Se tal dispositivo 
existisse antes, suas ideias poderiam ser revisadas, salvando muitas vidas e o tempo 
perdido em experiências equivocadas. 


Richard Braithwaite chamou atenção para a teoria dos jogos como uma ferra- 
menta à disposição do filósofo contemporâneo da moral que não havia sido descoberto 
até então. Isso aconteceu pouco depois do lançamento de Theory of Games and Econo- 
mic Behavior, de Von Neumann e Morgenstern. Naquele tempo, a teoria ainda não ha- 
via avançado tanto como veio a progredir depois, sobretudo no que diz respeito à arte 
da simulação. Efetivamente, muito caminho ainda resta a ser percorrido. Entretanto, 
o sucessivo reconhecimento da comunidade científica internacional tem dado desta- 
que à teoria na sua capacidade de avaliação de hipóteses. O ano de 2005, pela terceira 
vez, viu o prêmio Nobel de economia ser concedido a dois importantes pesquisadores 
dessa área, Robert Aumann, matemático israelense, e Thomas Schelling, economista 


dl2 E aventura política de Platão está registrada na Carta VII, enquanto a convocação de Marx foi feita por meio do 
Manifesto Comunista. 








estadunidense. 


O novo campo interdisciplinar aberto pela teoria dos jogos permitiu a economis- 
tas, matemáticos, psicólogos, neurologistas e biólogos tratarem do comportamento 
ético em suas pesquisas, quando aplicavam os experimentos que provocavam a coope- 
ração ou deserção dos agentes de acordo com as condições do jogo. Contudo, embora 
a teoria dos jogos tenha despertado o interesse de diversas matérias para a influência 
de valores éticos na tomada de decisão, não foi capaz ainda de atrair filósofos aca- 
dêmicos para sua linha de pesquisa. Os exemplos de Braithwaite, Harsanyi, Rawls, 
Martin Hollis são tão raros que suas contribuições podem ser listadas em um simples 
parágrafo. É notória a dificuldade de autores de ciências sociais em trabalhar conceitos 
formais da matemática. As confusões de Rawls em relação ao conceito minimax foram 
alvos do ataque certeiro de Harsanyi, um filósofo húngaro com formação de matemá- 
tico, imigrante tal com Von Neumann”. 


Uma Nova Ética 


Os problemas que surgiram com a globalização da economia provocaram a De- 
claração do Milênio da Assembleia Geral da Organização das Nações Unidas (ONU), 
em setembro de 2000. Para minimizar os efeitos perversos da produção industrial em 
escala mundial - poluição, devastação e miséria -, países que compõem a Assembleia 
Geral resolveram adotar uma nova ética de conservação e proteção do meio ambiente. 
O objetivo seria reduzir os danos provocados pela atividade humana e o comprome- 
timento de recursos naturais não renováveis necessários para satisfazer as demandas 
da espécie. O primeiro passo em direção a essa nova ética seria atender, entre outros 
pontos, a redução da emissão de gases relacionados com o efeito estufa - gás carbônico 
(CO,), óxido nitroso (N,0), metano (CH ) e ozônio (O.,) -; o manejo de matérias-primas 
conforme o conceito de desenvolvimento sustentável - nada seria transformado além 
do limite de sua reposição natural, isto é, sem comprometer a capacidade das próximas 
gerações atenderem suas necessidades”! -: promover o acesso equitativo e adequado do 
abastecimento de água potável; estimular a cooperação com objetivo de minimizar os 
efeitos de desastres naturais e provocados por humanos*”. 


A cada dia está se tornando mais claro os efeitos nefastos de concepção distorci- 
da adotada pela tradição de que os recursos naturais seriam inesgotáveis e estavam à 
disposição da espécie humana, por um duvidoso direito divino. A mudança climática 
causada pela elevação da temperatura do planeta tem provocado fenômenos atmosfé- 
ricos até então inéditos nos registros históricos. O aumento previsto para cerca de 2ºC, 
até o fim do século XXI, está diretamente relacionado com a produção industrial dos 
países desenvolvidos e os em desenvolvimento. O impacto dessa transformação atinge 
mais duramente os miseráveis da Terra. O diagnóstico desse problema e análise das 
possíveis soluções só podem ser bem esclarecidos com uma nova concepção de ética que 
utilize o instrumental da teoria dos jogos. 


313 Um exemplo da crítica de Harsanyi aos princípios de Rawls e a defesa do utilitarismo de regra pode ser apreciado em 
HARSANTI, J. 6. “Game and Decision Theoric Models in Ethics”, in AUMANN, R. & HART, S. Handbook of Game 
Theory with Economic Application, vol 1, cap. 19, pp. 0669-107. 

314 Conceito definido no Relatório da Comissão Brundtland (1981), veja DASGUPTA, P. “Uma Abordagem Dosada”, in 
Scientific American Brasil, ano 4, nº4], p. 98. 

915 Veja ASSEMBLEIA GERAL DA ONU. Declaración del Milenio, IV, 8 23, pp. 6 e 7. 








Para tanto, faz-se necessário uma observação atenta do modo pelo qual as ações 


individuais em interação e em larga escala resultam efeitos contrários aos planejados. 
A metaética, que não se envolve com questões práticas e procura apenas investigar 
conceitos e sua metodologia, não traz nenhuma contribuição à solução desses proble- 
mas. As tomadas de decisão dizem respeito a uma ética prática que avalia não apenas 
as estratégias escolhidas, mas as suas consequências. Por conseguinte, o modelo de 
Jogos facilita a tarefa de avaliação das melhores escolhas. Uma nova ética, como a pre- 
tendida pelas Nações Unidas, tem na teoria dos jogos um instrumento indispensável 
de compreensão do processo deliberativo e posterior comportamento humano. 


Os conceitos fundamentais para o tipo de discussão proposta já são debatidos 
por esses teóricos há, pelo menos, meio século. Pouco a pouco, filósofos contemporâne- 
os, como Peter Singer, de Um Só Mundo (2002), percebem o alcance desse novo método 
para uma interpretação mais precisa e realista da situação planetária atual. Raciona- 
lidade estratégica, agentes egoístas, cooperação, coordenação de esforços, equidade, 
confiança, entre muitos outros temas podem ser adequadamente estudados por meio 
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de jogos**. 


A civilização global traz ao primeiro plano problemas que a visão estreita do 
nacionalismo e do liberalismo econômico se recusam aceitar. As ações egoístas de tais 
agentes, econômicos e políticos, levaram o mundo à encruzilhada em que se encontra. 
Continuar agindo da forma insustentável e irresponsável que historicamente os seres 
humanos vêm se comportando terá por resultado um grau crescente de sofrimento e 
morte para maior parte dos seres vivos. Uma nova ética baseada nos jogos é capaz de 
prevenir os erros de tais opções e sugerir maneiras de amenizá-los. Motivação e aplica- 
ção de normas válidas são abordadas e justificadas do mesmo modo como o encontro 
de proposições adequadamente formuladas. À estratégia que servir para produção do 
melhor resultado conjunto, no sentido do ótimo de Pareto, tem sua implementação 
corretamente recomendada para todos envolvidos. Uma vez descoberto esse ponto 
ótimo os mecanismos necessários de penalidades devem ser acionados toda vez que 
haja um desvio, para que a cooperação seja mantida e se evite a situação dos jogos de 
soma zero, onde um só conseguirá obter mais se reduzir os ganhos da outra parte, na 
fronteira de eficiência. 


A identificação e punição dos exploradores da cooperação é um recurso chave 
para que a reciprocidade produza os efeitos desejados do empreendimento comum. Só 
assim, o dilema social resolve-se satisfatoriamente, sem cair em um ciclo de cooperação 
-exploração-solidão-cooperação. Essa transformação da ética está apta a recomendar 
as necessárias mudanças na estrutura da ONU, para que esta venha a cumprir seu 
papel efetivo de guardiã da paz, prosperidade e justiça no mundo. Com a vantagem de 
fornecer propostas realistas e amparadas no exame atento do momento. 


O aspecto realista - não confundir com o realismo platônico - da teoria dos jogos, 
ao invés de ser um empecilho, como poderiam argumentar céticos e relativistas, tem a 
vantagem de considerar a viabilidade de linhas de ação consideradas válidas para um 
determinado modelo de situação. Levar em conta problemas concretos de retaliação, 
erros de avaliação e informação corrompida, por exemplo, ajuda a refinar as escolhas 


916 Em Um Só Mundo, Peter Singer discute os principais problemas do mundo globalizada apontando soluções a luz da 
teoria dos jogos, em favor de uma nova ética. 








a ponto delas superarem as provas de um contexto real de vida. Portanto, em vez de 


problemas, a perspectiva realista ajuda a encontrar soluções possíveis para adaptação 
às mudanças climáticas, a eliminação da miséria e o desenvolvimento de uma perda 
gradual da soberania nacional, enquanto uma formação mais nítida de um governo 
mundial deverá chamar para si a responsabilidade de garantir segurança aos indivídu- 
os em qualquer parte do globo, em um futuro próximo. 


Esse é um projeto de longo prazo que será acelerado devido a imposições da glo- 
balização e seus efeitos sobre o meio ambiente. As nações e os indivíduos isoladamente 
não têm mais o poder de resolverem os problemas atuais que suas posturas egoístas ra- 
cionais detonaram. A miséria acompanha os seres humanos desde a mitológica “perda 
do paraíso”. A poluição agravou-se a partir da Revolução Industrial (c. 1750). Juntos, 
esses fenômenos ameaçam, agora, a sobrevivência da espécie no planeta, a despeito de 
todas outras ameaças vivas terem sido controladas - com exceção dos vírus e bactérias. 
Somente uma ética mundial pode concentrar esforços na direção de soluções práticas 
em escala global. As éticas universalistas modernas - kantianas ou utilitaristas, por 
exemplo - apresentam, por um lado, critérios que não podem ser aplicados, devido à 
vacuidade de suas formulações ou exigência de forte racionalidade, ou normas práticas 
que carecem de uma justificação que só pode ser apoiada em pressupostos de outra 
teoria. 


O contratualismo permanece como uma concepção teórica da validação de nor- 
mas que resiste a várias provas impostas pela nova ética modelada pelos jogos. Ao me- 
nos para a solução de Dilemas Sociais, a necessidade de uma instituição que fiscalize 
e obrigue o cumprimento da cooperação, seja por um contrato tácito ou explícito, é 
compatível com a interpretação própria da intuição hobbesiana. Seja no condomínio 
urbano, seja nas compras através da rede mundial de computadores, ou na Assembleia 
Geral, a figura do Leviatã deve ser encarnada por quem ocupar o cargo de síndico ou 
secretário-geral. Nesse sentido, o contratualismo, fundamentado na reciprocidade e 
apoiado nos jogos, pode vir a ser a base de uma nova ética factível para os tempos 
atuais. 


$25. Conclusão 


O mais difícil em uma caminhada é o primeiro passo. Uma longa caminhada 
não termina enquanto uma série de passos não ligar o primeiro ao último. Concepções 
imediatistas, em política, são adotadas por nações e seus respectivos governos que se 
arriscam a estabelecer projetos de larga escala, sem levar em conta os detalhes e aspec- 
tos elementares que compõem o todo. À visão macroeconômica amiúde gera desperdí- 
cios que sobrecarregam os povos de impostos e custos desnecessários. Em geral, sabem 
como começar, mas não como parar. 


A solução dos problemas vividos por toda uma geração neste começo de milênio 
depende de uma correta compreensão de como a ação de cada ser humano no passado 
contribuiu para o estado de coisas alarmante dos tempos atuais. A devastação do meio 
ambiente, superpopulação, má distribuição de recursos e miséria são consequências da 
cegueira de teorias para a ação individual e o impacto do somatório dos seus ganhos no 
resultado final da interação humana. Como parte da microeconomia, a Teoria dos Jogos 


chama atenção dos efeitos das escolhas de cada um sobre a condição dos envolvidos. 








O planejamento prévio e uma política imposta de cima para baixo não são capa- 


zes de resolver as dificuldades acumuladas por uma cadeia de erros sucessivos cometi- 
dos no passado. A mudança desse quadro ameaçador só ocorrerá quando se considerar 
seriamente os interesses individuais de cada envolvido e a satisfação de seus desejos no 
fim do jogo. De outro modo, políticas públicas macroeconômicas não podem aspirar à 
eficiência. Caso contrário, os bons indicadores iniciais, que facilmente aparecem, não 
conseguem se manter a longo prazo. À teoria dos jogos e da cooperação tem a seu favor 
a capacidade de esclarecer os conceitos e princípios básicos que sustentam a possibili- 
dade de êxito de interpretações sobre o comportamento dos seres vivos. 


O individualismo metodológico, que caracteriza esse ponto de vista, tornou-se 
uma concepção bem-sucedida, em face do fracasso evidente do positivismo nas ciên- 
cias sociais. Não existe fato social ou instituição que se sustente sem levar em consi- 
deração os interesses dos indivíduos que os geraram. As escolhas que os agentes fazem 
estão limitadas por sua condição física herdada e pela situação em que se encontram. 
O somatório dessas decisões produz a sociedade humana com os vícios e virtudes que 
possuam seus integrantes. 


O objetivo deste livro é pôr em relevo essa conclusão inevitável. Muitos outros 
aspectos importantes da teoria não puderam ser sequer abordados, para não pertur- 
bar a linha introdutória que foi traçada. Procurou-se, nessa primeira abordagem ao 
tema, evitar o desenvolvimento de fórmulas complicadas que caracterizam a pesqui- 
sa mais avançada em seu domínio. Na primeira parte, foram apresentados um breve 
relato histórico e os principais conceitos e preceitos dos jogos. Em seguida, um tema 
específico relacionado aos jogos com comunicação foi colocado como um exemplo da 
maneira que a teoria dos jogos trata um problema afim a diversas correntes filosófi- 
cas da linguagem e comunicação. Depois, a teoria da cooperação foi introduzida e os 
pontos relacionados à evolução mostraram a mudança de mentalidade motivada pelos 
torneios de computadores. 


Na segunda parte, o Dilema dos Prisioneiros Iterado indicou as propriedades 
das diversas estratégias que contribuem para manutenção da cooperação em contex- 
tos diferentes. O Dilema Social, ou Jogo dos Bens Públicos, é uma extensão daquele 
dilema para mais de dois jogadores, onde a necessidade de punição e de uma institui- 
ção que implemente as penalidades se faz notar. As dificuldades teóricas em relação à 
concepção de um agente egoísta e racional ficam evidentes em modelos de jogos como 
o Ultimato. Aqui, a equidade parece ser mais resistente do que a tentação de desertar, 
sobretudo, porque a possibilidade de retaliação é imediata a propostas injustas, na 
maioria das sociedades. Considerações sobre a reputação, passada e futura, bem como 
sentimentos morais - vergonha e indignação - são mobilizados para explicar o fenôme- 
no e a ausência de um comportamento que deveria ser, ao menos, próximo ao do “homo 
oeconomicus”, personagem cuja conduta seria, hipoteticamente, a recomendada pela 
teoria econômica. 


Esses poucos pontos apresentados foram bastante para listar uma série de disci- 
plinas ou campos de investigações separados que podem estabelecer relações através 
do uso de métodos típicos da teoria, por meio de simulações e modelos de jogos, que 
tratam do comportamento humano e do processo de deliberação. A teoria dos jogos e 


os modelos de agentes fazem a ponte entre disciplinas como a economia e as neurociên- 








cias, promovendo a formação da neuroeconomia. À partir desta nova disciplina, foram 


feitas pesquisas sobre como o sistema nervoso reage a situações econômicas, nas quais 
os participantes devem decidir de acordo com a reação esperada de outros agentes 
supostamente egoístas. 


As ambições iniciais de uma teoria que visava prever a melhor estratégia de atua- 
ção em qualquer contexto, na prática, cederam lugar a uma concepção mais promisso- 
ra de um instrumento de análise útil a muitas áreas de investigação. Com isso, a teoria 
dos jogos ampliou seu espaço de atuação enquanto fomentava novos setores, como a 
biologia matemática, a economia experimental e a mencionada neuroeconomia. Para 
a filosofia, a percepção de Braithwaite ainda aguarda a participação de mais autores 
interessados. Contudo, a ética é um campo que tem muito a evoluir com a implementa- 
ção de suas técnicas e formalização da intuição de muitos filósofos modernos: Hobbes, 
Rousseau, Hume, Bentham, entre outros. 


Forçoso dizer que muitos outros pontos relevantes para filosofia foram deixados 
de fora. Jogos que exigem habilidade e não são exclusivamente estratégicos não foram 
mencionados. Também os leilões e o interessante Jogo do Leilão do Dólar, de Martin 
Shubik, - chamado de Escalada, por Howard Raiffa - não tiveram mais do que uma 
menção em nota no segundo capítulo. O estudo de coalizões e pagamentos laterais, 
tipos de jogos cooperativos foram outra omissão notável, devido ao enfoque nos jogos 
não-cooperativos ter predominado. Nenhuma palavra foi escrita sobre o valor de Sha- 
pley, importante conceito da primeira fase da teoria e muitos outros temas que o leitor 
mais informado poderá estranhar a ausência. 


Tudo isso graças às limitações naturais que uma apresentação introdutória tem 
de enfrentar. A meta principal do plano de estudo da Teoria dos Jogos e da Cooperação 
para Filósofos foi colocar em uma linguagem acessível à maioria dos leitores interes- 
sados os aspectos centrais da teoria como vem sendo desenvolvida atualmente. Como 
primeiro contato, atacou-se de imediato os conceitos comuns à filosofia e aos jogos, 
a fim de estabelecer uma aproximação natural de quem possui pouca ou nenhuma 
informação sobre o assunto. Se os textos elaborados foram bem-sucedidos deverão 
despertar no leitor o desejo de buscar mais informação em pesquisas mais avançadas. 


A rigor é praticamente impossível mostrar de uma vez todo campo de investi- 
gação trabalhado por um setor em franca expansão. De um modo geral, procurou- 
se apontar a tendência predominante e que vem sendo reconhecida pelas sucessivas 
premiações recebidas por teóricos dos jogos, desde o Nobel de economia de 1994. São 
poucos os títulos sobre teoria dos jogos que se mantêm em catálogo, disponíveis em 
português, alguns introdutórios outros voltados a especialistas. Dentre os que estão à 
disposição do público, a maior parte se dirige a economistas e administradores. Raros 
são aqueles que se dedicam ao público geral — amiúde, traduções de obras estrangeiras. 


Teoria dos Jogos e da Cooperação procurou atender uma faixa de leitores lusó- 
fonos de outras disciplinas, mas que também possam estar interessados em discussões 
filosóficas a respeito do processo de escolha, tomadas de decisão e o consequente com- 
portamento de agentes humanos ou não. Nesse sentido, as fórmulas matemáticas fo- 
ram reduzidas ao mínimo necessário para não prejudicar a explicação. Na maior parte 
das vezes, foram postas por extenso, verbalmente, na linguagem natural. Entende- 


se que todas as formulações simbólicas podem ser traduzidas no vernáculo corrente, 








embora isso resulte em uma perda de precisão e em um número maior de caracteres. 


Assim, frequentemente, preferiu-se uma expressão da forma “a probabilidade que este 
resultado possa acontecer tem a chance menor do que cinco porcento” ao invés da 
simples inequação (p < 0.05)". 


Com razão o leitor mais exigente pode objetar que tal verbalização contraria 
o “espírito” científico e a pretendida precisão buscada pela teoria. Não obstante, o 
esforço da divulgação, por vezes, obriga o sacrifício do rigor acadêmico em função de 
uma causa nobre de atrair os iniciantes para um tema que estes poderão mais tarde 
desenvolver com maior objetividade. A meta de Teoria dos Jogos e da Cooperação para 
Filósofos é, portanto, servir como uma pequena escada que depois deve ser descartada 
por quem tiver alcançado um patamar mais elevado. Deve ser interpretado como um 
incentivo, ou primeiro passo, para quem queira iniciar sua pesquisa nessa área, mas 
não sabe ainda por onde começar. 


À teoria dos jogos já avançou para níveis dos quais não é mais possível retroceder. 
O neodarwinismo da biologia evolutiva contemporânea, a ciência cognitiva da inteli- 
gência artificial, a teoria dos sistemas complexos dinâmicos e a neurociência do estudo 
da mente desenvolvem pesquisas que não foram previstas no estágio inicial da teoria 
dos jogos. Filósofos contratualistas e utilitaristas contemporâneos já usam-na como 
base de sua argumentação e princípios gerais. Para entender o debate atual é preciso 
conhecer os pressupostos originais e ter uma visão abrangente do seu desdobramento 
conceitual. A partir daí, o interesse de cada um deverá direcioná-lo ao acompanha- 
mento dos assuntos que lhe forem mais próximos. E depois, possivelmente, produzir 
novas pesquisas em textos críticos sobre os problemas encontrados. 


Da maneira que evoluiu, a própria teoria dos jogos é um exemplo de campo in- 
terdisciplinar aberto a todos os pesquisadores, nas áreas mais diferentes. Nesse senti- 
do, construiu a percepção de ser um método de análise eficiente e versátil das situações 
de interação entre agentes egoístas. O que reforça a tendência em considerá-la um 
meio adequado para solução dos problemas atuais vividos pela humanidade em uma 
escala global. O acúmulo de erros e confusões metodológicos de uma tradição acadê- 
mica impediu o desenlace de novas perspectivas para o trato da crise provocada pela 
globalização. Sem fazer tábula rasa de toda essa cultura filosófica, a teoria dos jogos 
abre horizontes onde podem ser trabalhados sem preconceitos os problemas mais pró- 
ximos aos indivíduos que sobrevivem em um mundo poluído, com escassez de recursos, 
superpopuloso e em meio a uma desigualdade que lança pelo menos um bilhão de hu- 
manos em uma condição de vida miserável. 


A solução desses problemas passa por uma minimização da corrupção, da supe- 
ração da tragédia dos comuns e da necessidade do estabelecimento de um organismo 
mundial com poderes de intervenção legitimado pelo consenso dos representantes de 
toda população do planeta. Todos esses aspectos e muitos outros são abordados nos 
modelos de jogos. Tal técnica de sistematização ajuda a encontrar respostas para as 
questões gerais e específicas que lhe são formuladas. Portanto, a teoria dos jogos se 
apresenta como a disciplina mais promissora para abordagem desses temas. 


As próximas gerações têm, então, uma maneira de examinar os problemas que 


811 Esse é um exemplo apresentado por AXELROD, R. “Advancing the Art of Simulation in the Social Sciences”, 
83.3, p. 9. 








cedo ou tarde terão de enfrentar pela sua própria sobrevivência, livres dos vícios e pre- 


conceitos da academia. Nesse sentido, do mesmo modo sugerido por Harsanyi, assim 
como não se deixa de ensinar aritmética às crianças, também não se deveria furtar de 
lhe ensinar a teoria dos jogos, por mais difícil e contraintuitiva que possa parecer, à 


primeira vista?!8, 


Os jogos têm a vantagem de simplificar, ao mesmo tempo em que tornam mais 
precisos, o estudo da interação e comportamento humanos. Serviu para apresentar 
com nitidez o que há de elementar em muitas formas de convívio social, cuja valoração 
é difícil de hierarquizar no âmbito da teoria política. Em um jogo, os jogadores procu- 
ram realizar da melhor maneira os objetivos que lhe são propostos, seguindo as estra- 
tégias disponíveis, segundo uma interpretação correta das regras. Do mesmo modo, 
em sociedade, os cidadãos visam atingir um plano de acordo com os princípios parti- 
culares e as normas gerais aceitas pela comunidade. O resultado conjunto das escolhas 
feitas pelos indivíduos reflete-se em uma constituição mais ou menos justa, conforme 
a capacidade de cada um em perceber a cooperação como a melhor solução para todos. 


Para estudar o mundo social, necessitamos de conceitos rigo- 
rosos. Impõe-se que emprestemos precisão a termos tais como 
utilidade, informação, comportamento ótimo, estratégia, equi- 
líbrio, ajuste e muitos outros. A Teoria dos Jogos de estratégia 
desenvolve noções rigorosas para todos esses vocábulos e, assim, 
nos capacita a examinar a perturbadora complexidade social 
sob nova luz. Sem esses conceitos precisos, jamais poderíamos 
esperar que a discussão saísse de um estágio puramente verbal 
e nos veríamos para sempre cingidos a uma compreensão mui- 
to restrita, se é que conseguiríamos alcançá-la (MORGENS- 


TERN, O.”Prefácio”, in DAVIS, M. Teoria dos Jogos, p.12). 


Oskar Morgenstern considerava importante a formalização matemática da teoria 
e que toda tentativa de divulgá-la para o grande público fosse feita por quem tivesse o 
conhecimento profundo de todas as complexidades teóricas, bem como participado de 
sua elaboração. Duas características das quais carece o autor de Teoria dos Jogos e da 
Cooperação para Filósofos. No entanto, este ousou implementar essa tarefa na ausência 
de alguém mais habilitado que se dispusesse a fazê-lo e com a consciência dos riscos de 
ter cometido possíveis equívocos. Mas, a importância de se recuperar o tempo perdido 
pela falta de textos acessíveis, obrigou à decisão pela tomada do difícil primeiro passo. 
Que essa iniciativa temerária estimule autores credenciados a cumprirem sua missão 
de divulgador, responsabilidade social de todo cientista e acadêmico. 


918 Veja HARSANYI, J. C. “Normative Vality and Meaning of Von Neumann-Morgenstern Utilities”, in 
BINMORE, K., KIRMAN, A. & TANI, P. Frontier of Game Theory, cap. 15, 1, p. 307. 
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partir de meados'do século XX, a Teoria dos Jogos tornou-se um 

importante instrumento de análise dos problemas cognitivos e 
morais que a Filosofia vem se ocupando hã séculos. Ao lado da Teoria 
da Cooperação, a Teofia dos Jogos apresenta soluções e paradoxos que 
ajudam a compreênder melhor às limitações da racionalidade humana. 
Seus principais conceitos, os modelos de jogos, as estratégias, pontos 
de equilíbrio e a melhor maneira de tomar uma decisão em interações 
que envolvam os interesses de agentes egoístas são tratados aqui. 
Os problemas éticos e cognitivos revelados pelos jogos e explicados, 
enquanto se aborda desde os aspectos históricos às técnicas de simulação 
por computador. 





